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L’«identità» degli oggetti matematici nell’evoluzione temporale, l’inseribi- 
lità in discorsi sempre più ampi, che è stata oggetto del commento a + Geometria 
e topologia+, certo ha colpito l’attenzione di molti pensatori. Un esempio fra i 
molti è dato da Pierre Duhem: « Le proposizioni che costituiscono le scienze uni- 
camente matematiche sono, al massimo grado, verità universalmente accettate; 
la precisione del linguaggio, il rigore dei procedimenti dimostrativi, non lasciano 
spazio a divergenze durature tra le concezioni dei vari geometri; attraverso i se- 
coli, le dottrine si sviluppano in continuo progresso, senza che le nuove conqui- 
ste facciano perdere nulla dei domini acquisiti in precedenza». 

Ancora più chiaro è Duhem ove mette a contrasto fisica e geometria: « La fi- 
sica non progredisce come la geometria che aggiunge nuove proposizioni defini- 
tive e indiscutibili a quelle che già possedeva, progredisce invece perché l’espe- 
rienza produce di continuo nuovi disaccordi tra leggi e fatti e perché, incessan- 
temente, i fisici ritoccano e modificano le leggi per poter rappresentare i fatti in 
modo pit esatto». . 

Questa identità degli enti matematici ha certo riscontro in fatti reali. Ma essa 
è un estremo dell’opposizione identità/differenza e si vedranno ora alcuni esem- 
pi, avendo cura di rilevare i contrasti che coesistono con le concordanze. 

Si è spesso osservato come il metodo assiomatico sia per eccellenza il metodo 
della matematica (cfr. l'articolo *+Assioma/postulato +, per esempio. Si pongano 
anche a confronto i due articoli « Funzioni » e + Applicazioni+ e si vedrà nel secon- 
do caso come venga organizzata una descrizione assiomatica di molte delle que- 
stioni trattate nel primo articolo). Questo metodo ha indubitabilmente origini 
antiche: certo ben prima di Euclide si sono avute costruzioni teoriche organizza- 
te in modo deduttivo, a partire da poche premesse assunte inizialmente, T'utta- 
via è con gli Elementi che si dispone di un testo articolato e sistematico con il 
quale si può istituire un confronto fecondo. 

Ecco la prima proposizione euclidea: 


PROPOSIZIONE I. Sv una retta terminata data costruire un triangolo equilatero. 


La costruzione (e con ciò la dimostrazione della sua esistenza) consiste nel trac- 
ciare il cerchio BCD, con centro A e raggio AB, il cerchio ACE, con centro B 
e raggio BA e nel congiungere il punto C (una delle due intersezioni dei cerchi) 
con A e B. Poiché AC = AB e BC = AB «cose che sono uguali a una stessa sono 
uguali anche tra loro» e perciò AC=BC=AB (fig. 1). 

Si è osservato fin dall’antichità come l’esistenza del punto C che dà una delle 
intersezioni dei cerchi non segua dagli assiomi e dai postulati precedenti. Il testo 
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euclideo va quindi integrato. Un nuovo moderno «Euclide emendato » sarebbe 
per molti aspetti assai più ricco e sofisticato dell’originale se si dovesse tener con- 
to del gran numero di osservazioni, come la precedente, che si sono accumulate 
nei secoli. Ma non è tanto questa differenza che preme qui segnalare. Se si sup- 
plisce l’opportuno postulato dell’intersezione dei cerchi, si osserva poi immedia- 
tamente che la dimostrazione euclidea diviene completamente rigorosa. Essa ha 
inoltre caratteristiche d’immediatezza e di semplicità tali da renderla pratica- 
mente insostituibile. . l 

Non solo quindi viene riconosciuto negli Elementi lo stesso nostro ideale di- 
mostrativo perfino nei luoghi ove occorrono integrazioni, ma anche qui, e in 
molti altri casi, ci si trova d'accordo nel proporre come le più naturali le stesse di- 
mostrazioni, pur con le opportune modifiche. 1 

Ma questa identità sembra quasi costituire uno sfondo per mettere in mag- 
gior rilievo molte e fondamentali differenze che riguardano principalmente la 
natura degli enti geometrici. Certo gli enti geometrici degli Elementi non sono 
enti fisici, ma «enti ideali» in senso pieno; ciò non toglie che essi organizzino 
una descrizione che nel suo complesso va collegata allo spazio della nostra espe- 
rienza. 

I concetti moderni di «modello» e di «struttura», cosî importanti e fecondi, 
sono privi di senso se visti in connessione con gli Elementi. Questi ultimi, nella 
misura in cui sono pensati descrivere l’unica geometria possibile, sono per ciò 
stesso l’unico modello e l’unica struttura geometrica, il che svuota di significato 
questi concetti, se applicati in questo caso. 

Inoltre, sebbene si sia debitori alla scienza greca di molti dei concetti che ora 
si ritrovano nell’area descritta da +simmetria+, vi sono molte sottili differenze, 
soprattutto a livello dimostrativo. Non vi è intanto una diretta derivazione del 
concetto espresso in greco da obpuetpoc ‘commensurato, proporzionale (cfr. 
l’articolo +Razionale/algebrico/trascendente +), aggettivo usato da Euclide De 1] 
per indicare grandezze che ammettono una misura comune (« Liupetpa ueyton 
Meyerai tà TE) aÙrà) petp9 perpipeva», ecc.), cioè grandezze commensurabili 
nel nostro linguaggio. Ma al di là dello slittamento di significato dei termini, è 
nei metodi dimostrativi stessi che si notano profonde differenze. 

Con molta evidenza la cosa si nota in Apollonio. Ogni qual volta nel libro I 
del suo trattato appaiono le «sezioni opposte», cioè i due rami di una stessa iper- 
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Figura 1. 


Costruzione di un triangolo equilatero. 
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bole (come nella prop. 59 del I libro, per fare un esempio tra i più tipici), le con- 
siderazioni di *+simmetria+ sono ridotte in modo da rendere le dimostrazioni as- 
sai strane per un lettore che non abbia familiarità con la matematica greca. Nella 
proposizione citata, dopo aver costruito una sezione (ossia un ramo dell’iperbole) 
Apollonio procede a ricostruire i dati e poi la sezione opposta, anziché ricostruire 
immediatamente la sezione cercata usando la simmetria. E non è che un esempio 
fra innumerevoli altri. 

Tornando ad Euclide, nel libro V degli Elementi ove è esposta la teoria delle 
proporzioni, il maggiore strumento dimostrativo della matematica classica, si ha 
la seguente proposizione (11): 


PROPOSIZIONE. / rapporti che sono uguali a un medesimo rapporto sono uguali fra 
loro, cioè da A:B=C:DeC:D=E:F si deduce A:B=E:;F. 


Che significa questo? Conferma ancora una volta che la proporzione A:B=C': D 
va pensata come un tutto unico, e non come affermante l'uguaglianza di rapporti 
(in caso contrario al teorema si potrebbe sostituire la prima delle nozioni comuni: 
«Cose uguali a una stessa cosa sono uguali tra loro»). 

Quante implicazioni questo possa avere sulla considerazione di figure sim- 
metriche rispetto a una data retta, per esempio, è evidente. La considerazione di 
rapporti «a sinistra» e «a destra» non conduce automaticamente a proporzioni 
proprio perché, almeno di primo acchito, non è lecito questo modo di intendere 
le proporzioni. Chi ha familiarità con la matematica greca sa bene quanta pazien- 
za sia talora necessaria per liberarsi di certi « pregiudizi» moderni e intendere an- 
che il senso degli sviluppi dimostrativi in luoghi ove la simmetria sembrerebbe 
vanificare ogni necessità dimostrativa. 

Ora certo i Fondamenti della geometria (Grundlagen der Geometrie, 1899), la 
«carta dell’assiomatica moderna» a giudizio di Bourbaki, sono pur sempre una 
presentazione della geometria erede per molti aspetti della tradizione euclidea, 
mala direzione del successivo programma di Hilbert, volto a formare delle conce- 
zioni generali dei formalismi matematici, quali giochi con i testi simbolici non 
richiedenti, in linea di principio, alcuna interpretazione, per usare le parole di 
Manin, è irriducibile ai termini della matematica greca. 

Il confronto con la scienza greca è profondamente significativo anche per un 
altro aspetto disciplinare. 

Secondo un giudizio universalmente acquisito la fondazione della logica si 
deve ad Aristotele. 

Ora, quando si legge, ad esempio, nei Primi analitici [25b, 37-39] che «se A 
si predica di ogni B, e se B si predica di ogni C, è necessario che A venga predi- 
cato di ogni C », ci si trova certo su un terreno familiare a tutti coloro che hanno 
una qualche esperienza matematica e l’idea di una figura come 


22 


Sistematica locale 638 


(se A si predica di ogni B tutti i B hanno la proprietà A, ecc.) rende trasparente 
l’implicazione. Tuttavia si è qui ben lungi dall’essere in un contesto matematico 
o afferente in qualche modo alla matematica. Occorrerà un processo di molti se- 
coli, fino all'Ottocento, perché si realizzi quell’unità fra logica e matematica che 
ha prodotto la «logica matematica» moderna. 

Si può ammettere, certo, che gli Elementi abbiano un’organizzazione confor- 
me alla logica aristotelica, ma ciò è vero in un senso molto generale, per quanto 
riguarda l'architettura complessiva dell’opera e non nel senso che la logica vi 
compaia come uno «strumento» per sviluppare singole dimostrazioni od orga- 
nizzare complessi di dimostrazioni. Vi sono negli Elementi forme deduttive non 
sillogistiche e, in generale, le dimostrazioni sono modellate sull’oggetto matema- 
tico piuttosto che ricondotte a tipi standard dal punto di vista logico. 

È molto importante sottolineare questa autonomia del discorso matematico, 
autonomia che diverrà ancora più marcata con il sorgere della scienza nuova, per 
ben capire come l’unità che si viene a realizzare tra matematica e logica nel seco- 
lo scorso presuppone un determinato grado di sviluppo delle due discipline. L’e- 
sperienza dell’algebra è, ovviamente, fondamentale nell'opera di Boole, ma non 
è solo l’«algebrizzazione della logica» che segna la differenza con Aristotele, è 
l’intero modo di intendere la disciplina in connessione con l’attività scientifica. 

Si tratta di osservazioni molto semplici. Esse suggeriscono tuttavia come 
spesso anche a una lettura «accurata» dei testi e a una interpretazione fonda- 
mentalmente «esatta», come in questo caso della breve frase citata di Aristotele, 
possono corrispondere non poche drastiche semplificazioni. 


Anche l’opposizione +continuo/discreto + che inerisce ad aspetti fondamen- 
tali dell'esperienza umana, ha suscitato, nell’antichità, le riflessioni teoriche più 
profonde nel pensiero greco. Tra le più celebri vi sono i paradossi di Zenone sul 
moto, esposti e analizzati da Aristotele; in essi, forse più che altrove, si avverte 
la profonda tensione concettuale che pervade l’opposizione. Una «soluzione » dei 
paradossi di Zenone che faccia capo a una interpretazione univoca e corrisponda 
a un'unica idea risolutiva non si è data fino ad ora, né può darsi se nella coppia 
continuo/discreto si manifesta una contraddizione effettiva. Ma il problema cer- 
to può essere approfondito e la formulazione moderna della continuità della ret- 
ta data da Dedekind costituisce un progresso fondamentale. Già Aristotele [Fist- 
ca, 2332, 24-28] aveva osservato come «in due sensi si dicono infiniti tanto la 
lunghezza quanto il tempo e in genere ogni continuo: o per divisione o per gli 
estremi, Pertanto, gli infiniti che sono tali secondo la quantità, non possono toc- 
carsi in un tempo finito; quelli, invece, che sono tali secondo la divisione, lo pos- 
sono perché il tempo stesso è infinito sotto questo aspetto > (cfr. +Divisibilità +). 

Il continuo è infinito per divisione. Questo aspetto della continuità è colto 
con grande chiarezza da Aristotele. Se si considera il caso della retta, ciò signi- 
fica che tra due suoi punti A e B c’è sempre un C' intermedio: 


+ i‘IMeLL 
A C B 
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Ma questo non è il solo aspetto e ancora Aristotele lo avverte con grande 
chiarezza, tant’è che l’aporia di Zenone non è ricondotta a questo solo aspetto ma 
all’essere il tempo e lo spazio, sotto questo rispetto, uguali. Questo è un modo 
certo geniale per rendere pensabile il moto, ma lascia inesplorato un aspetto del- 
la continuità d’un ente preso per se stesso isolatamente. 

Dedekind, con'uno scritto del 1872 (l’anno stesso del Programma di Erlan- 
gen) reca un contributo decisivo al problema della comprensione della continui- 
tà. Si tratta del saggio Continuità e numeri irrazionali (Stetigheit und irrationale 
Zahlen). Vi si osserva come, considerati i numeri razionali con la loro relazione 
d’ordine, un numero a ripartisca tutti i numeri razionali in due classi A, e Ag, 
entrambe infinite, delle quali la prima contiene tutti gli a, con a, <a e la seconda 
tutti gli a, con a,>a (a stesso può porsi nella prima o nella seconda classe). 

Questa proprietà trova riscontro in una consimile proprietà dei punti di una 

retta: un punto A divide i punti della retta in due classi, formata la prima dai 
punti A alla sinistra di 4 e la seconda dai punti 4, alla destra di 4 (analoga os- 
servazione vale per 4). Cosa ora fa sî che la retta sia continua e che tale non sia il 
sistema dei numeri razionali? 
l Se si fissa un riferimento sulla retta, è possibile disporvi al modo solito tutti 
i numeri razionali e, come è ben noto, la presenza dei segmenti incommensura- 
bili si manifesta nel fatto che vi sono punti sulla retta che non corrispondono a 
numeri razionali (come il segmento che rappresenta la diagonale del quadrato 
che ha per lato l’unità di misura). 

Ebbene questa differenza, questa «mancanza» di numeri corrisponde esatta- 
mente al fatto che ogni suddivisione dei punti della retta in due classi tali che 
ogni punto della prima classe stia a sinistra di ogni punto della seconda è realiz- 
Zata esattamente da un punto, mentre ciò non avviene per le classi di razionali 
tali che ogni numero della prima sia inferiore a ogni numero della seconda. Non 
vi sono partizioni dei punti della retta che abbiano rispetto all'ordinamento la 
stessa caratteristica di quelle che provengono dai suoi punti che già non proven- 
gano da punti. 

«Che ognuno trovi il principio enunciato tanto evidente e tanto concordante 
con la sua propria rappresentazione della retta, — osserva Dedekind, — ciò mi sod- 
disfa al massimo grado, perché né a me né ad altri è possibile dare di questo 
principio una dimostrazione qualsiasi. La proprietà della retta espressa da que- 
sto principio non è che un assioma, ed è solo sotto forma di questo assioma che 
noi pensiamo la continuità della retta, che riconosciamo alla retta la sua conti- 
nuità ). 


Figura 2. 


x 


Il punto P' sulla retta non è rappresentato da alcun numero razionale (corrisponde 


infatti a V/2). 


Sistematica locale 640 


Con la formulazione di Dedekind della continuità si ha una concezione della 
retta che è molto più ricca e articolata di quella presente nella matematica classi- 
ca: il continuo non è tale solo per la +divisibilità + infinita (cosa, come si è visto, 
già osservata da Aristotele) e un’analisi del moto che si fondi solo su questa pro- 
prietà non è adeguata. Ciò non risolve l’aporia di Zenone ma la rende «più pen- 
sabile » poiché non ci si limita ad affermare che una certa connotazione non esau- 
risce il concetto della continuità, ma si dà di quest’ultima un'ulteriore caratteri- 
stica: la retta come +insieme+ ordinato è analizzata più profondamente. 

Tuttavia, come è ben noto, Dedekind, dopo aver «creato» i numeri reali in 
modo che il continuo numerico abbia le stesse proprietà di continuità della retta, 
rifiuta a quest’ultima (in un approccio fondazionale, non certo nella didattica!) 
un’uguale dignità. Giunge cosî a compimento un desiderio che fa capo a una 
tradizione antichissima: l’intera matematica ridotta ai numeri. Al tempo stesso 
la geometria se non sacrificata, come scienza autonoma, certo viene diminuita. 

L’esempio più celebre di + dualità+ è quello dato dal piano proiettivo. L os- 
servazione che i punti e le rette in un piano ordinario hanno comportamenti 
«analoghi» è certo molto antica. Due punti arbitrari e distinti individuano una 
retta, cosi come due rette in generale, cioè se non sono parallele, individuano un 
punto. La restrizione «non parallele» è stata di fatto eliminata nella pratica del 
disegno (ove ogni costruzione che fa intervenire una coppia di rette parallele 
— una direzione -— si svolge in modo del tutto simile alla costruzione corrispon- 
dente ove le rette non siano parallele) ben prima che avesse un fondamento teo- 
rico la nozione di «punto all’infinito ». All’inizio del secolo scorso, aggiunti al 
piano ordinario i «punti all'infinito» ordinatamente disposti sulla «retta all’in- 
finito», si hanno le premesse per il piano proiettivo, l’ambiente naturale per la 
dualità fra punti e rette. e 

Su due fatti si vuol richiamare l’attenzione, due fatti che non costituiscono 
un semplice prolungamento del vecchio nel nuovo: i punti all’infinito permetto- 
no di non far distinzione in una costruzione grafica tra elementi al finito e all’in- 
finito, unificano costruzioni all'apparenza assai diverse. E la stessa cosa assegnare 
un’iperbole mediante i suoi asintoti e un suo punto oppure mediante due tan- 
genti con il loro punto di contatto e un suo punto. La costruzione di un arbitra- 
rio punto ulteriore procede in modo del tutto conforme, per fare un esempio. Ma 
non è per questo e per altre consimili costruzioni che si dispone del piano proiet- 
tivo. A questo punto si dispone soltanto del piano ordinario con l’aggiunta di ele- 
menti ideali; si ha il piano proiettivo quando i nuovi enti appaiono come del tutto 
identici ai punti ordinari, quando non c'è pit la retta impropria ma ogni retta ha 
lo stesso ruolo. Occorre un poderoso sforzo di astrazione per prescindere dalle 
qualità all'apparenza più concrete di punti e rette e concepirli come definiti dal 
loro reciproco interagire (un inizio, come si vede, del discorso di Hilbert). 

Ancora, perché abbia senso la dualità occorre una distinzione fondamentale: 
se un linguaggio, con una semplice sostituzione terminologica, descrive due real- 
tà diverse, è ovvio che lo stesso linguaggio (i nomi dei termini sono arbitrari) può 

descrivere differenti realtà. Si è perciò costretti a distinguere tra il linguaggio e 
ciò che il linguaggio descrive. È un esempio fondamentale del concetto di mo- 
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dello. Come si vede, anche se il concetto di dualità sembra legarsi a fatti tra i più 
semplici, esso diviene disponibile solo dopo acquisizioni teoriche di grande ri- 
lievo. 

Negli esempi esaminati sino ad ora, il confronto tra tematiche classiche e 
idee innovative era in qualche modo contenuto dalla natura dell’argomento. Con 
il gruppo Bourbaki, autore di un’opera tuttora in esecuzione, dal titolo assai si- 
gnificativo di Elements de mathématique (1939 sgg.), si pone coscientemente l’idea 
di una matematica globalmente «nuova». 

Bourbaki rinunzia a una «filosofia» della matematica (rinunzia spesso enfa- 
tizzata da qualche componente del gruppo) proponendosi più «modestamente» 
di catalogare e sistematizzare i metodi della matematica. Al tempo stesso Bour- 
baki sottolinea le possibilità euristiche del metodo assiomatico, purché esso sia 
inteso nella sua effettiva essenza, come strumento per aumentare le possibilità 
dimostrative. 

Un ruolo essenziale nel progetto bourbakiano ha il concetto di struttura ma- 
tematica +: l’organizzazione generale del discorso matematico secondo strutture 
algebriche, strutture d’ordine, strutture topologiche, ove il singolo oggetto ma- 
tematico non è un «dato», ma il frutto di una molteplicità di determinazioni. 

L’idea nuova e profonda della matematica come una totalità, come un’archi- 
tettura ove i singoli oggetti acquistano la loro individualità solo in rapporto al 
tutto, è certamente un grande contributo di Bourbaki, ma l’idea della matema- 
tica come una totalità organizzata non è una caratteristica inscindibile dall’ap- 
proccio organizzato attraverso il concetto di struttura matematica. Essa è pre- 
sente anche nell’approccio categoriale. 

Anche per questa ragione, la distanza che separa la descrizione categoriale 
degli oggetti matematici dalla loro descrizione strutturale non è forse cosî grande 
come spesso si crede. Giustamente Manin parla di una descrizione del primo 
tipo come « duale» rispetto a quella del secondo. 

Dal punto di vista della teoria delle strutture, osserva Manin, un gruppo è 
un #insieme+ dotato di una determinata struttura, mentre dal punto di vista della 
teoria delle categorie un gruppo è un oggetto della categoria di tutti i gruppi. Da 
questo secondo punto di vista un oggetto riceve la propria identità dal coesistere 
con altri oggetti della stessa natura, dal modo con il quale esso è posto in relazio- 
ne con loro. Ma anche dal punto di vista bourbakiano il concetto di gruppo appa- 
re come determinato da una pluralità di confronti, confronti a livello di struttu- 
ra, confronti che conducono alla scelta di quella particolare struttura che è tale 
non in sé ma in confronto ad altre strutture ad essa paragonabili. È ovvio che 
l’affermare che una certa legge di composizione è associativa non significa so- 
lamente disporre di una «proprietà» per la legge in questione ma anche, e forse 
principalmente, porre una differenza specifica con altre leggi di composizione 
che non sono associative. 

L’approccio categoriale sembra invece proporre aspetti differenti e forse an- 
cor più innovativi per due riguardi: per quanto riguarda il «divenire» e per 
quanto riguarda il concetto di «fondamentale ». 

«La dialettica della opposizione struttura/evoluzione, — osserva Manin, — ri- 
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flette la generale opposizione scientifica essere/divenire. Il successo della teoria 
degli insiemi come linguaggio universale della matematica e della concezione del- 
le strutture matematiche come realizzazione concreta di questo linguaggio ha 
segnato uno spostamento di accento sui primi elementi di queste opposizioni. Le 
concezioni relative sempre più diffuse nei fondamenti, gli assiomi categoriali, 
ecc. segnano il movimento inverso, quando ‘divenire’ e ‘incompiuto’ sono 
considerati primitivi». 

In molti articoli di questa Enciclopedia si è accennato all'approccio categoria- 
le come recante in sé questo significato di apertura verso il «divenire» e non è il 
caso di ripercorrere gli esempi. Vale la pena invece di riflettere sull’importanza 
di un’assunzione teorico-programmatica di questo tipo. Forse è presto per trarre 
conclusioni significative, ma ad una almeno sembra si possa accedere: accanto 
all'approccio categoriale è necessario valutare attentamente la storia della mate- 
matica degli ultimi trecento anni. 

È chiaro infatti che se l’aritmetizzazione dell’analisi e la riduzione della mate- 
matica alla teoria degli insiemi appaiono come processi del tutto necessari, se ap- 
pare necessaria l’introduzione del «rigore» ottocentesco per eliminare ogni ap- 
pello all’intuizione del continuo, l'approccio categoriale, privato di una legitti- 
mità storica, può apparire al più un utile «complemento » all’approccio insiemi- 
stico, ma non può pretendere a una pari importanza. Se invece le acquisizioni 
delle quali s’è detto appaiono «storicamente » date e frutto di scelte determinate, 
ecco che nell'esame di queste scelte è possibile costruire un percorso che mostri 
come anche l’approccio categoriale può giudicarsi erede di un processo concreto. 

Ora è significativo a questo riguardo come numerosi articoli recenti (di Law- 
vere, ma anche di Kock, Reyes, ecc.) mostrino la possibilità di affrontare molti 
problemi secondo tecniche che, sia pure in contesti molto sofisticati, ripropongo- 
no certi interventi « diretti» dell'analisi settecentesca, con un uso raffinato degli 
«infinitesimi». 

Fin troppo ovvio dunque, che questo debba essere collegato a un esame ac- 
curato delle ragioni per le. quali gli infinitesimi, e le nozioni correlate, sono stati 
eliminati dall’analisi. 

Non si tratta naturalmente di «demolire » o sostituire la matematica classica. 
È ben possibile però (e non mancano esempi nella storia della matematica) che 
l'abbandono di determinati metodi abbia avuto come motivazione precipua la 
difficoltà d’una loro spiegazione teorica, la quale può ben essere poi possibile 
come frutto di acquisizioni datesi successivamente. 

Il secondo aspetto innovativo è invece nel modo stesso di concepire i fonda- 
menti. Esso è legato alla teoria delle categorie ma, se pure è eccessivo giudicare 
contingente questo legame, non è certo la teoria delle categorie a essere realmen- 
te in gioco. 

Si è osservato che in molti tra i più vari settori della matematica molte co- 
struzioni fondamentali appaiono legate a categorie, funtori 0 trasformazioni na- 
turali (cfr. l’articolo + Trasformazioni naturali | categorie +): facilmente e chiara- 
mente descrivibili in questi termini. In particolare, ha osservato Lawvere, il con- 
cetto di «coppia di funtori aggiunti» sembra il più diffuso nella «pratica» mate- 
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matica. Esso dunque, che appare naturalmente al centro del nostro agire concre- 
to in quanto matematici, deve avere un pari ruolo come oggetto fondamentale del- 
la riflessione teorica. Esprimendosi con una certa semplificazione: fondare signi- 
fica porre al centro della teoria ciò che già è al centro nella pratica matematica 
Non la ricerca dell’atto pit semplice del nostro pensiero, o delle leggi elementari 
del pensiero, o dei primi fatti psicologici legati al pensiero matematico viene giu- 
dicato come fondamentale, ma ciò che l’analisi concreta mostra essere al centro 
della matematica stessa. 

Si potrebbe naturalmente proporre una lunga lista di obiezioni a questo ap- 
proccio (chi giudica cosa è al centro e perché? cosa vuol dire « pratica matemati- 
ca»?, ecc.) e molte ne sono state poste. Ma preme più osservare come ad esso si 
collegano molte questioni di grande rilievo. È ovvio intanto che questo concetto 
di fondazione è dato storicamente. Oggi il concetto di coppia di funtori aggiunti 
ha un ruolo fondamentale, ma per nessuna ragione, se non ponendo dei vincoli 
soggettivi agli sviluppi futuri, si può giudicare che cosî sarà anche in futuro. Ecco 
che allora la ricerca di ciò che è centrale si lega all’analisi del processo storico 
come esso concretamente si svolge sino al tempo della ricerca: la storia della ma- 
tematica appare come parte del concetto stesso di fondazione (pur essendo, è ov- 
vio, distinguibile una parte «operativa» da una parte storica). 

Inoltre, ed è forse l’aspetto che Lawvere tende a sottolineare maggiormente 
questo concetto di fondazione non è una riflessione su ciò che è la matematica ma 
vuole essere elemento essenziale per lo sviluppo della matematica stessa. 

Maa giudizio di chi scrive pare importante, anche se certo di minore impor- 
tanza, che in questa prospettiva la storia della matematica non venga ad essere 
«accanto » alla matematica, ma organicamente inserita in essa. [M.G.]. 
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Applicazioni 


I. Nozione generale ed esempi. 


La nozione di applicazione è un modello matematico molto generale di 
aspetti vari della realtà e del pensiero. Essa si genera quale forma dell’idea 
di una corrispondenza a coppie di oggetti di una classe, o di un insieme, con oggetti di 
un’altra classe. Una tale corrispondenza si realizza nella descrizione di processi 
che si sviluppano nel tempo, quando ad ogni momento del tempo corrisponde 
un certo stato del sistema studiato. Essa viene usata nello studio di operazioni 
su degli oggetti: il risultato dell’operazione viene associato all’oggetto sul quale 
l'operazione viene eseguita. Essa può servire per descrivere dipendenze di ge- 
nere diverso nei casi in cui una certa caratteristica di una situazione è com- 
pletamente definita da un’altra caratteristica. Essa chiarisce l’immagine che si ha 
di simmetria, di omogeneità, ecc.; nella simmetria di un ornamento, o di un 
cristallo, si tratta di applicazioni dei suoi elementi (dei particolari del rabesco, 
degli atomi), le quali conservano la struttura dell’ornamento, o del reticolo 
del cristallo. 

Nell'ambito della teoria degli insiemi la nozione di applicazione è seconda- 
ria rispetto a quella di insieme. Si chiama applicazione, oppure (in un uso 
più restrittivo) funzione di un insieme X in un insieme Y una corrispondenza f, 
la quale ad ogni elemento x di X associa un unico elemento y di Y, spesso in- 
dicato con f(x). Qui x si chiama argomento dell’applicazione f, mentre f(x) 
si dice il suo valore sull'argomento (o nel punto) x. L'insieme X si chiama domi- 
nio di definizione (0 semplicemente dominio) di f, mentre l’insieme Y si chiama 
dominio dei valori (0 codominio) di f. L'applicazione f con il dominio X e il 
codominio Y spesso si scrive cosî: f : X+ Y. Negli impieghi pratici il caso più 
frequente è quello in cui X e Y sono insiemi di numeri; interi, razionali, reali, 
oppure complessi, che possono essere considerati quali risultati di possibili mi- 
surazioni di queste o quelle caratteristiche della realtà. Ma nella matematica 
teorica si studiano applicazioni d’insiemi assai più generici. Se l’insieme X è 
finito, l’applicazione f può essere data con una tabella, nella quale accanto ad 
ogni possibile valore dell'argomento xe X si scriva il valore f(x). Esempi ben noti 
sono le tavole dei logaritmi, delle funzioni trigonometriche e di altre funzioni 
speciali. (A rigore, queste tavole dànno non la stessa funzione f, ma solo una 
parte dei suoi valori su una parte dei valori dell'argomento e, per di più, appros- 
simativamente, a meno di un certo numero di cifre decimali dopo la virgola). 
Un altro modo di dare una funzione numerica consiste nell’esibire il suo grafico. 
Infine un’applicazione può essere data per mezzo della descrizione della proce- 
dura che, applicata ad ogni elemento xe X del dominio di f e dopo la sua ese- 
cuzione, fornisce il valore f(x). Hanno questa caratteristica le regole scolastiche 
per calcolare la somma, o il prodotto di due numeri dati nella scrittura deci- 
male, e, in generale, la maggioranza delle «formule» per le funzioni che per- 
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mettono di calcolare i loro valori. Se la descrizione della procedura per il calcolo 
è cosî completa che la sua esecuzione può essere affidata a un uao mec- 
canico, per esempio a un calcolatore, essa si chiama algoritmo, mentre la corri- 
spondente applicazione f si dice calcolabile algoritmicamente. De. 
Quella che segue è la descrizione particolareggiata di alcuni esempi di ap- 
plicazioni e dei meccanismi della loro realizzazione nel modellare situazioni 


fisiche, umane e sociali. 


1.1. Stato di un sistema fisico quale funzione del tempo. 


Uno dei processi fisici più semplici è il moto di un corpo nello spazio. ne 
si può fare astrazione dalle dimensioni finite del corpo e O quale 
punto materiale, cosi che la sua posizione può essere data dallo spazio da — 
percorso lungo la sua traiettoria. Si può immaginare il moto di una ia che 
cade, di una automobile, o di un satellite della Terra. Supponiamo che ©) lu 
zio e il tempo siano misurati in prescelte unità di misura e che sia fissato i 
momento iniziale del tempo. Allora ad ogni momento del tempo corrisponde 
lo spazio percorso r(t). Se si fa astrazione dalla limitatezza del tempo di os- 
servazione, si può ritenere che # assuma tutti i valori reali =0 (« futuro ) oppu- 
re persino tutti i valori reali (« futuro » e «passato »), e 7 sarà una tg) 
R(numeri reali = tempo) > R(numeri reali =spazio). In un modello più reali- 
stico la funzione 7 è definita solo in un certo intervallo finito; ciò, spesso, va 
tenuto presente anche quando si descrivono sistemi a lunga vita, quali il si- 

solare, o l’universo. ui 
a descrizione completa della posizione di un punto materiale è data sf tre 
coordinate: per esempio, dalle distanze da tre piani fissi perpendicolari tra loro. 
Perciò il moto del punto è completamente descritto dalle variazioni di oa 
coordinate quali funzioni del tempo, cioè da una applicazione Lo 
(spazio), dove R® è l’insieme delle terne ordinate di numeri reali, cioè il pro- 
dotto cartesiano Rx Rx RR. Sea i . 

Più in generale, sia S un certo sistema fisico, il cui stato, in ogni are 
del tempo, sia dato da certe «coordinate generalizzate» reali, 91, ..., In. er 
esempio, se S è il sistema solare, g1, ..., 94, possono essere le coordinate (ne si- 
stema connesso con il Sole) di tutti i pianeti che, in una prima PE 
ne, possono essere considerati quali punti materiali. In questo caso l’evolu- 
zione del sistema è data da una applicazione R(tempo)> R"(spazio delle coor- 
dinate generalizzate, o spazio configurazionale del sistema), cioè da un DEE 
di n funzioni, q,(t), ..., g,(t). Un altro esempio è dato dal gas in un cilin to 
con stantuffo; per esempio, dal vapore in un cilindro di una macchina 2 va: 
pore. Il suo stato, in ogni momento, è definito da tre numeri, V, p, T (volume, 
pressione e temperatura), mentre le funzioni V(£), p(t), T(1), che dosi 
la dipendenza di queste caratteristiche dal tempo, contengono l'informazione 
fondamentale sul lavoro di una tale «macchina termica». L'insieme di tutti i 
valori ammissibili delle coordinate generalizzate, gq,, > Ins NOR coincide ne- 
cessariamente con tutto lo spazio R”: il moto di un sistema può essere limi- 


st 
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tato da vincoli che individuano solo una parte U di questo spazio. Per esempio, 
la posizione di un segmento materiale, del genere di un righello (se si trascu- 
rano la sua larghezza e spessore, ma non la lunghezza), è definita dalle coor- 
dinate cartesiane dei suoi estremi, diciamo (91, 9a, 43) € (41, 4, 4); però esse 
non possono essere arbitrarie in R°, ma devono essere soggette alla condizione 
di conservare la lunghezza / del righello: (9,—9)?+ (490—-95)+(493—-q9)=, 
e questa condizione individua un sottoinsieme UCRÉ. Il moto di un tale seg- 
mento è dato da una applicazione R+U. 

Nella teoria dei mezzi continui, quali i liquidi e i gas, i campi elettrici ed 
altri, lo stato di un sistema in ogni momento del tempo è dato da un insieme 
di numeri non finito, ma infinito, che è ugualmente comodo considerare quale 
applicazione (cfr. oltre). 

Il tempo è l’argomento universale delle funzioni che descrivono tutti i pos- 
sibili processi fisici, astronomici, geologici, storici, economici, tecnici e di altro 
genere. Storicamente la comprensione di una tale possibile descrizione dei pro- 
cessi ha avuto una enorme importanza nello sviluppo della matematica e delle 
scienze naturali. Probabilmente l’idea fondamentale fu quella secondo la quale 
in una tale descrizione si potevano ritenere preassegnati «contemporaneamente », 
«staticamente », tutti i momenti del passato e del futuro, benché il passato scom- 
paia continuamente e il futuro appaia sotto forma di un istante fuggevole e non 
sia mai dato come realtà. Solo questa idea permette di sperare nell’adeguatezza 
della descrizione di un processo mediante una applicazione R+ U, dove la retta 
dei tempi R intervenga quale oggetto matematico unico. A sua volta, la for- 
mazione di questa idea si è basata sull’osservazione di processi dotati di una 
netta regolarità e importanti per lo sviluppo dell’economia e della società, quali 
il moto delle stelle (orientamento nella navigazione) e gli straripamenti dei grandi 
fiumi (determinazione del tempo delle semine). Le tabelle e i metodi per calco- 
lare il moto delle stelle, le eclissi solari, ecc., che risalgono all’epoca in cui ebbe 
origine la civiltà, sono l’incarnazione di questa idea. 

L'efficacia del considerare l'insieme dei momenti del tempo come un tutto 
unico ha predisposto all’accettazione del punto di vista generale teorico-insiemi- 
stico, dove di solito il dominio X di un'applicazione modella l’insieme delle « di- 
verse possibilità», una parte o la maggioranza delle quali non si realizza mai 
nel sistema dato. In questioni di contabilità, o in calcoli tecnologici, probabil- 
mente non s’incontreranno mai numeri maggiori, diciamo, di 10!0%; tuttavia, 
l'algoritmo per la somma è formulato, e a buon diritto, per tutti i numeri in- 
teri: solo cosi l’aritmetica diventa effettivamente utile e comoda nell’uso. 

Le idee connesse con lo sviluppo dei processi nel tempo furono alla base di 
molte nozioni matematiche più specifiche. Per esempio, il problema di calco- 
lare la velocità istantanea e l’accelerazione di un punto materiale in un moto 
arbitrario fu risolto da Newton con l’invenzione del calcolo differenziale. Fra gli 
esempi che si sono avuti più tardi vi è il cosiddetto «problema di Cauchy» per 
diverse classi di equazioni differenziali, dove la premessa è l’idea secondo la 
quale è possibile predire univocamente l’evoluzione di un sistema, se ne sono 
noti lo stato e la velocità della sua variazione al momento iniziale del tempo. 
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Ancora, l’immagine fisica del moto di un punto materiale lungo una deter- 
minata linea — la sua traiettoria — è strettamente legata alla nascita della geome- 
tria analitica nelle opere di Descartes [1637]. Questi iniziò lo studio sistematico 
dei grafici delle funzioni numeriche f, quali sottoinsiemi del piano R x R, costi- 
tuiti da tutti i possibili punti con le coordinate (x, f(x)) e, più in generale, dei 
grafici delle dipendenze funzionali « implicite» del tipo f(x, y)=0, del genere 
dell'equazione della circonferenza x°+y?—1=0. Lo sviluppo di questa idea 
in senso concettuale ha condotto all’attuale identificazione di una funzione 
f:X+Y con il suo grafico nel prodotto cartesiano X x Y, quale sottoinsieme 
di tipo determinato. Questa espressione della nozione di funzione nel linguag- 
gio della teoria degli insiemi sarà esaminata nei particolari più oltre. 

Per concludere, è da notare ancora un altro aspetto importante della de- 
scrizione matematica dei processi evolutivi direttamente legato alla possibilità 
di considerare la retta dei tempi come un oggetto unico. Le leggi dell’evolu- 
zione si possono dividere grosso modo in due classi: locali e globali. Un esempio 
di legge locale dell’evoluzione è la regola di Newton che descrive il moto di 
un punto materiale sotto l’azione di una forza: in ogni momento del tempo 
l'accelerazione del punto è proporzionale alla forza che su esso agisce. Suddivi- 
dendo l'intervallo di tempo durante il quale si segue il moto del punto in tante 
piccole parti, è possibile calcolare approssimativamente questo moto, rite- 
nendo che la velocità resti costante in ognuna di queste parti, e sia quindi ac- 
cresciuta a salti della quantità prescritta dalla legge di Newton. Il passaggio al 
limite conseguente al rimpicciolimento infinito della suddivisione significa in- 
tegrare questa legge locale del moto. Pit tardi si notò che il moto nel suo in- 
sieme può essere descritto globalmente mediante il cosiddetto principio varia- 
zionale: il moto di un punto viene definito minimizzando sulla sua traiettoria 
una certa grandezza fisica che si chiama azione. Questo principio presuppone 
la definizione preliminare di azione quale funzione su tutte le possibili traiet- 
torie, persino quelle fisicamente irrealizzabili. Negli ultimi decenni questo prin- 
cipio ha avuto un profondo sviluppo nella trattazione della meccanica quanti- 
stica secondo Feynman, dove l’indefinibilità della traiettoria di una micropar- 
ticella permette di attribuire un certo significato all’idea che la particella com- 
pia il moto «simultaneamente lungo tutte le traiettorie». 


1.2, Campi. 


I sistemi e i processi fisici quali il flusso di un liquido o di un gas, la 
distribuzione del pulviscolo di materia infrastellare, la propagazione del calore, 
gli effetti elettromagnetici e gravitazionali e molti altri sono descritti in termini 
di evoluzione dei campi. Il tipo più semplice di campo — campo scalare in un 
dominio D dello spazio fisico — è modellato matematicamente da una appli- 
cazione della forma D+ R, oppure D+C: ad ogni punto di D è associato un 
numero reale, o complesso. Questo numero può corrispondere alla densità me- 
dia della materia in un piccolo dominio attorno al dato punto, alla temperatura 
nel dato punto, ecc. Il campo gravitazionale nella fisica classica è un esempio 
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di campo vettoriale: al punto è associato un vettore, la risultante di tutte le 
forze di attrazione gravitazionale in quel punto. Il flusso di un liquido in ogni 
momento del tempo pure è descritto da un campo vettoriale, il campo delle ve- 
locità del flusso. Lo stato istantaneo di un campo elettromagnetico nella teoria 
classica è descritto da due campi vettoriali nel dominio D: il campo delle tensioni 
dell'interazione elettrica e il campo delle tensioni dell'interazione magnetica. 
I valori del campo in un punto possono avere una natura ancora più complessa; 
quella di tensori di dimensioni e di varianza diverse (tensore delle tensioni 
nella teoria dell’elasticità; tensore energia-impulso). Per la descrizione dei campi, 
quali applicazioni, esiste un apparato matematico speciale: la teoria delle varietà 
differenziabili e i fibrati su esse. Al dominio D corrisponde, per esempio, il 
suo fibrato tangente 7D, costituito dai vettori tangenti in tutti i possibili punti 
di D; l’applicazione strutturale f : TD+D associa ad ogni vettore tangente la 
sua origine; il campo vettoriale corrisponde all’applicazione sezione s : D+ TD 
con la proprietà p(s(x))=x per ogni xe D. 

La nozione di campo descrive bene un sistema fisico in quei domini dove 
non vi sono sorgenti di liquido, o di calore, accumulo di materia gravitante, ca- 
riche elettriche, ecc. Questi effetti corrispondono a singolarità del campo nel 
senso generale della parola: rottura della continuità, valori infinitamente grandi 
del campo, salti d’ogni genere e cosi via. Lo studio delle singolarità, della loro 
evoluzione nel tempo, della loro stabilità, ecc., fa parte dei problemi più impor- 
tanti relativi alla maggior parte dei modelli matematici dei processi continui. 
La corrispondenza «campo-singolarità» è un esempio tipico del dualismo ge- 
nerale «continuo-discreto ». 

Nella moderna teoria quantistica del campo si considerano campi di strut- 
tura ancora più complessa. Nella meccanica quantistica classica ad ogni gran- 
dezza fisica (coordinata, impulso, energia, ecc.) viene associato un certo opera- 
tore lineare (cfr. $ 1.5). Corrispondentemente il posto dei campi classici delle 
grandezze viene occupato dai campi di operatori. Questi oggetti matematici 
sono molto complessi e non esiste ancora una loro teoria conseguente, che am- 
metta un confronto diretto con la realtà fisica. Una delle difficoltà è connessa 
con le singolarità del campo che si hanno nelle sue origini, per esempio, negli 
elettroni per la teoria del campo elettromagnetico. È, questo, il cosiddetto pro- 
blema delle divergenze della teoria del campo, che i fisici risolvono elaborando 
metodi di rinormalizzazione. Questi metodi forniscono un esempio notevole 
di frammenti di matematica efficaci, benché, a rigore, siano internamente con- 
traddittori. 


1.3. Traduzione e codificazione. 


L’uso da parte dell’uomo di lingue naturali diverse, quale mezzo fonda- 
mentale per comunicare, registrare e conservare il sapere, conduce alla neces- 
sità di realizzare la traduzione dei testi da una lingua all'altra conservandone il 
significato. Modellare una traduzione con la nozione di applicazione non sa- 
rebbe completamente adeguato per due motivi. Primo, lo stesso insieme dei 


Applicazioni 706 


testi che hanno significato nella lingua non è nettamente definito. Secondo, la 
traduzione notoriamente non è univoca persino al livello di singole parole: si 
veda un qualsiasi vocabolario bilingue. Assai meglio la nozione di applicazione 
è applicabile alle traduzioni da un linguaggio artificiale ad un altro. I linguaggi 
artificiali di programmazione, quali il Fortran, l’Algol e molti altri, furono ela- 
borati quali mezzi di comunicazione fra luomo e i calcolatori. La loro struttura 
è approssimativamente uguale a quella di frammenti del gergo matematico 
umano, ciò che facilita il loro uso da parte dei programmatori, ma rende i testi 
in questo linguaggio inaccettabili per la macchina calcolatrice. Il linguaggio in- 
terno di una tale macchina, al contrario, è oltremodo frazionato e lontano dalla 
facoltà mentale umana standard perché possa essere efficacemente usato nella 
compilazione di un programma appena complesso. Perciò un programma scritto 
dall'uomo, diciamo in Algol, dev'essere tradotto in un programma in codici di 
macchina. Anche questo processo di traduzione è di solito affidato alla mac- 
china calcolatrice, la quale lo attua usando un programma-codificatore scritto 
una volta per tutte. È comodo considerare la traduzione di un programma in 
Algol in un programma in codici di macchina quale calcolo di un’applicazione- 
codificazione definita sull’insieme di tutti i possibili programmi in Algol rego- 
larmente compilati. Poiché la traduzione è affidata a un calcolatore, essa è una 
applicazione algoritmicamente calcolabile (cfr. sopra). 

Negli ultimi anni idee analoghe sono andate diffondendosi più largamente 
sia in connessione con la teoria e la pratica della traduzione automatica delle 
lingue naturali, sia in forza di esigenze interne della linguistica. In particolare 
si sta elaborando un linguaggio-mediatore semantico universale fra tutte le lin- 
gue naturali. Un tale linguaggio deve servire per la registrazione diretta dei 
«significati» dei testi naturali, indipendentemente dalle loro specifiche espres- 
sioni nelle diverse lingue naturali e dai vari modi sinonimici di una tale espres- 
sione in ogni singola lingua. Perciò una delle prime esigenze per questo lin- 
guaggio-mediatore consiste nel fatto che la traduzione di ogni testo naturale 
{come prima, di una loro classe finita) dev'essere univoca, cioè dev'essere ben 
modellata da una conveniente applicazione. La comprensione di questa esigenza 
ha già condotto a individuare nuove e interessanti categorie linguistiche; per 
esempio, le parole-operatori, le cui funzioni consistono nel far variare in modo 
«unidirezionale » il significato delle parole da esse dipendenti. Per esempio, le 
parole ‘buono’, ‘forte’, ‘molto’, ‘velocemente’, ecc., sono realizzazioni di uno 
stesso operatore: ‘segno di intensificazione’, che nel linguaggio-mediatore può 
essere una unità espressiva. 

Un'altra esigenza consiste nel fatto che la traduzione nel linguaggio-media- 
tore di un testo naturale dev'essere un’applicazione algoritmicamente calcolabile, 
cosî come la traduzione dall’Algol in codici di macchina, 0, quanto meno, pros- 
sima a questo ideale. 

Ancor prima sono sorti modelli matematici di traduzione nella teoria della 
codificazione. Questa teoria risale a due fonti: alla cifratura di messaggi nella 
lingua naturale per ottenerne la segretezza (in questioni militari, nella corrispon- 
denza diplomatica) e alla codificazione di messaggi per essere poi trasmessi 
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mediante questo o quel canale di comunicazione (codice Morse, codice ma- 
rinaresco con le bandiere, codificazione dei risultati di misurazioni mediante 
successioni di impulsi in canali di comunicazione tecnici, ecc.). Qui l’univocità 
delle procedure di codificazione e di decodificazione, che permetta di conside- 
rarle applicazioni, è solitamente posta a fondamento della stessa struttura del 
codice. Possono far eccezione i cifrari con scelte casuali onde aumentare la segre- 
tezza; però, anche in questo caso, la decodificazione è solitamente univoca; al- 
trimenti le scelte casuali potrebbero alterare l’informazione trasmessa. Il modo 
di ottenere una buona cifratura consiste nell’eliminare al massimo le regolarità 
e conformità presenti nel testo iniziale (frequenza di simboli, ripetizione di 
gruppi di simboli, ecc.). Lo studio dei problemi che in tal modo si presen- 
tano è stato intrapreso e portato molto avanti, in particolare dal noto matematico 
e ingegnere americano Shannon [1948]. 

Lo studio e la progettazione di apparecchiature elettroniche per la elabo- 
razione delle informazioni (amplificatori, contatori, calcolatori...) ha condotto 
alla famosa immagine della «scatola nera». Si chiama cosf un oggetto avente un 
«ingresso » e un’«uscita » e tale che all’osservazione si prestano i segnali in uscita 
dovuti ai diversi segnali in ingresso, ma non la struttura interna di questo 
oggetto che attua l’elaborazione dei segnali. Pertanto una «scatola nera» realizza 
una certa applicazione {insieme dei segnali in ingresso} + {insieme dei segnali 
in uscita}, ma non è noto come essa la realizza. Tale è la situazione anche nello 
studio iniziale di progettazione di queste apparecchiature. Ciò fu di grande 
stimolo per far penetrare uno stile «funzionale» nella mentalità della pratica 
ingegneristica. Dopo la seconda guerra mondiale, con la comparsa della ci- 
bernetica, queste idee furono estese ai modelli fisiologici, dove sovente solo l’ap- 
plicazione stessa si presta a uno studio sperimentale, mentre i meccanismi della 
sua realizzazione sono oggetto di una ricostruzione a partire da essa e, ove sia 
possibile, da dati complementari indiretti. Per esempio, nelle indagini elettro- 
encefalografiche si sottopone chi è oggetto della sperimentazione a questa o 
quella situazione; cosî, gli si presentano degli stimoli visivi di questo o quel tipo, 
che costituiscono i segnali d’«ingresso è. Si osservano cosî dei potenziali, rile- 
vati con elettrodi su! cranio, oppure introdotti nel cervello. Questi potenziali sono 
considerati quali segnali d’«uscita», e il cervello quale scatola nera. In termini 
analoghi si può descrivere la maggioranza degli esperimenti tipo «stimolo-ri- 
sposta ». Una stabilità del carattere della reazione agli stimoli di un dato tipo 
interviene quale proprietà fondamentale dell’applicazione nel corrispondente 
modello matematico. 

L’idea della «scatola nera» corrisponde alla separazione generale in mate- 
matica fra la nozione di applicazione e la nozione che esprime il modo di rea- 
lizzarla: calcolo, tabella, formula, algoritmo (cfr. sopra). Questa separazione 
non è stata subito individuata e regolarizzata. Essa è strettamente legata alla 
formazione delle idee teoretico-insiemistiche ed è tuttora oggetto di discus- 
sioni semifilosofiche, nonché all’origine dei problemi riguardanti la possibilità 
di rappresentare le diverse classi di funzioni con questo o quel mezzo. Più oltre 
si analizzeranno nei particolari tali questioni; per il momento importa descrivere 
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un arco di nozioni importanti legate alle applicazioni calcolabili algoritmica- 
mente. 


1.4. Algoritmi e calcolabilità. 


Si sono già ricordati gli esempi pit noti di algoritmo: le regole per calcolare 
in scrittura decimale la somma e il prodotto di due numeri interi dati, pure in 
scrittura decimale. Che queste regole abbiano un carattere del tutto meccanico 
è dimostrato dal fatto che esistono da molto tempo dispositivi meccanici (o elet- 
tronici) per eseguire questi calcoli: le macchine calcolatrici. Un altro esempio 
già ricordato è il programma-codificatore che realizza un certo algoritmo per l’e- 
laborazione dei testi in un linguaggio di programmazione in testi nel linguaggio 
dei codici di macchina. 

Più in generale, supponiamo di avere un insieme (potenzialmente infinito) 
di dati; per esempio, di testi, cioè successioni finite di segni di un prefissato al- 
fabeto finito. Potrebbero essere le scritture decimali, o binarie dei numeri interi 
(negli alfabeti rispettivamente {o, 1, ..., 9} e {o, 1}), oppure i programmi in 
Algol, ecc. Un algoritmo è un insieme di regole per l'elaborazione di tali testi in te- 
sti nello stesso, 0 in un altro, alfabeto. Un algoritmo dev'essere dato mediante un 
numero finito di procedure del tipo seguente: a) devono essere descritti i pas- 
saggi elementari dell’elaborazione dei testi; 5) devono essere indicate le regole 
che in modo univoco definiscono la successione delle scelte dei passaggi ele- 
mentari in dipendenza del testo iniziale e, possibilmente, del carattere di tutti 
i passaggi già compiuti al momento attuale; c) devono essere indicati i criteri 
per la fine della procedura dell'algoritmo. Se, dopo l’esecuzione di un numero 
finito di passaggi, l’algoritmo finisce, si dice ch’esso è applicabile al testo iniziale 
e che /o elabora nel testo ottenuto dopo il passaggio finale. 

Secondo il significato di queste definizioni l’algoritmo per la somma di due 
numeri decimali è applicabile ad ogni coppia di tali numeri. L’algoritmo per 
calcolare la radice quadrata di un numero decimale positivo @ è applicabile 
ad a=4 e ad a=0,625, ma non è applicabile ad a=2. Esso diventa applicabile 
a tutti i numeri decimali positivi se viene convertito nell’algoritmo per il calcolo 
approssimato, completandolo con una regola finale; diciamo: «arrestarsi dopo 
aver calcolato la sedicesima cifra decimale dopo la virgola». 

Nella logica matematica è stata compiuta un’indagine esauriente della classe 
delle applicazioni assegnabili mediante algoritmo. L’inconveniente tecnico, le- 
gato al fatto che l’insieme sul quale è dato l’algoritmo non è univocamente de- 
finito, può essere superato mediante un metodo tecnico tipo numerazione di 
Géòdel dei testi su un alfabeto finito. Ciò permette di ricondurre lo studio di 
ogni applicazione calcolabile algoritmicamente allo studio di applicazioni date 
su un sottoinsieme di numeri naturali e a valori nello stesso insieme di numeri 
naturali. 

In quest'ordine d’idee il risultato fondamentale consiste nel fatto che è stata 
individuata la classe delle funzioni (parzialmente) ricorrenti. Ogni concreta fun- 
zione ricorrente si calcola mediante una procedura i cui passaggi elementari 
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sono scelti da un elenco fissato una volta per tutte. La cosiddetta tesi di 
Church afferma che tutte le applicazioni algoritmicamente calcolabili sono fun- 
zioni ricorrenti. 

I grandi e moderni calcolatori elettronici digitali, se non si considerano i li- 
miti materiali sul tempo di calcolo e sul volume della memoria, sono in grado 
di calcolare ogni funzione ricorrente e quindi, d’accordo con la tesi di Church, 
realizzano tecnicamente ogni algoritmo per l’elaborazione di testi. In questo 
senso i grossi calcolatori sono universali. 


1.5. Misura in meccanica quantistica. 


La misura di una caratteristica di un sistema fisico, quale la posizione, o la 
velocità di un punto materiale, la pressione di un gas, la luminosità di una 
sorgente luminosa, ecc., appartiene al numero di operazioni fondamentali che 
stabiliscono il legame fra la teoria e la realtà. Nella fisica classica si presuppone, 
per principio, che una misura può essere eseguita in modo tale da alterare poco 
quanto si vuole lo stato del sistema e che, per ogni procedura di misurazione, 
possono essere elaborati metodi che garantiscono una piccolezza arbitraria di 
questo disturbo. A lungo questo principio è stato considerato fondamentale per 
conclusioni gnoseologiche, quali quella dell’esistenza obiettiva delle proprietà 
studiate di un sistema. 

Tuttavia, nello studio del micromondo il postulato sulla possibilità di tali 
misure è risultato del tutto infondato. È sostanzialmente impossibile chiarire 
questo punto rimanendo nell’ambito delle idee della fisica classica. Il fatto è che, 
per una descrizione adeguata dei microprocessi, bisogna ricorrere ad un nuovo 
linguaggio e, soprattutto, a una sua nuova interpretazione, diversa per prin- 
cipio. Questo linguaggio è fortemente matematicizzato ; volendo può essere con- 
siderato come un frammento di una parte speciale della matematica (l’analisi 
funzionale). Peraltro, sono noti diversi argomenti intuitivi a favore della rinuncia 
al postulato classico sulla misura. Si consideri, per esempio, il problema di una 
misura esatta della posizione e della velocità di un elettrone nel vuoto, immagi- 
nandolo classicamente come un punto materiale. Per misurare le coordinate 
dell'elettrone bisogna «illuminarlo» e misurare l’irradiazione da esso riflessa. 
Qui l'esattezza della misura è limitata dalla lunghezza dell’onda luminosa. Per 
aumentarla bisogna diminuire la lunghezza di quest'onda. Però, l'«illuminazio- 
ne» dell’elettrone consiste nel fatto che su esso si dissipa un fotone (un quanto 
di luce), la cui energia cresce al decrescere della lunghezza d’onda. Perciò nella 
dissipazione una parte dell’energia del fotone, trasmessa all’elettrone in modo 
imprevedibile, può diventare arbitrariamente grande, ciò che imprevedibilmente 
altera la velocità (l'impulso) dell'elettrone. 

Lasciando questi argomenti intuitivi si passi ora a una più esatta chiarifi- 
cazione del modello matematico del processo di misurazione nella fisica quan- 
tistica a partire dallo stesso esempio dell’elettrone nel vuoto (lo schema è sem- 
plificato: non si tiene conto dello spin dell’elettrone e si ammette ch'esso si 
muova con una velocità trascurabile rispetto alla velocità della luce). Lo stato 


Applicazioni 710 


istantaneo dell’elettrone è descritto, invece che dalla coppia (coordinata, velocità) 
della fisica classica, dalla cosiddetta J-funzione, che è una funzione a valori com- 
plessi, definita nei punti dello spazio fisico R? (0 in un dominio dove può es- 
sere localizzato l’elettrone). Il quadrato del modulo di questa funzione in un 
punto, moltiplicato per il volume di una piccola sfera con il centro in questo 
punto, fornisce la probabilità di rinvenire l’elettrone in detta sfera. Finché non 
si effettua un esperimento reale per localizzare l’elettrone, la sua y-funzione 
varia nel tempo secondo la legge di evoluzione che solitamente viene descritta 
mediante l’equazione differenziale di Schròdinger. Se si vuole, si può immagi- 
nare che, invece del moto dell’elettrone, abbia luogo un moto dell’informazione 
su esso, espresso dalla W-funzione. Supponiamo che ora si faccia un esperimento 
per misurare le coordinate dell’elettrone. Secondo le idee ortodosse della mec- 
canica quantistica, al momento della misura, la y-funzione dell’elettrone varia 
di un salto: se esso è stato rinvenuto in un piccolo dominio dello spazio, la 
sua nuova y-funzione sarà concentrata approssimativamente in questo dominio. 
Più in generale, nel modello matematico della misura, ad ogni grandezza fisica 
(coordinata, energia, impulso, ecc.) è associato un operatore lineare, che è una 
applicazione dello spazio di tutte le possibili L-funzioni in se stesso. La sua li- 
nearità significa che, alla somma di due y-funzioni, esso associa la somma delle 
loro immagini, mentre al prodotto di una y-funzione per un numero associa il 
prodotto della sua immagine per lo stesso numero. Le predizioni probabilistiche 
circa i risultati della misura sono effettuate sulla base di speciali manipolazioni 
dell’algebra lineare applicate all'operatore di misura e alla d-funzione dell’elet- 
trone al momento della misura. Questo operatore lineare è appunto il modello 
matematico fondamentale della misura. 


1.6. Funzioni di utilità in economia. 


In una serie di modelli matematici s’introducono oggetti, grandezze e appli- 
cazioni, la cui diretta osservazione è difficoltosa o, in generale, impossibile e, cio- 
nonostante, tali da condurre a una teoria che concorda con la realtà e la descrive 
bene. Le y-funzioni, viste nel punto precedente, sono probabilmente l’esempio 
più chiaro. Convincono meno oggetti analoghi in modelli economici e sociali. 
Tuttavia, in virtà della loro notevole diffusione, si descriverà uno degli esempi 
più semplici. 

Esso si riferisce al cosiddetto modello di puro scambio. In questo modello 
si parte dall’idea di un insieme di merci di / tipi diversi e di un insieme di m 
consumatori {C,, ..., C,,}. Se un dato consumatore ha x; unità di merce del 
tipo #, il suo assortimento di merci è descritto dal punto (x, ..., x)e R° Dal 
significato del modello segue che x;=0; inoltre il volume di merce per ogni 
tipo può ritenersi limitato, cosi che il vettore (x, ..., x) giace solamente in 
un certo dominio P dell’ottante di dimensione /. Si presuppone che ogni 
consumatore €; sia caratterizzato da una certa funzione di utilità v; : P+R, a 
valori reali. Il significato di questa funzione consiste nel fatto che C; prefe- 
risce l'assortimento di merci (x,, ..., x;) a quello (1, ..., x) se, e solo se, 


rr 
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U;(X,; ..., x)>%i(x1, -.-, x{). Si presuppone che due consumatori possano scam- 
biarsi una parte delle loro merci se, con questo, entrambe le funzioni di utilità 
crescono. In condizioni analoghe sono possibili anche scambi multipli. 

Lo stato completo del modello è descritto da un punto di P®, prodotto car- 
tesiano m-multiplo del dominio P per se stesso, e questo punto è l’insieme de- 
gli assortimenti di merci di ognuno degli #1 consumatori. Uno stato si dice 
ottimale secondo Pareto se non vi è un altro stato nel quale tutte le funzioni 
di utilità non diminuiscono e almeno una cresce. L’idea consiste in questo: 
se lo stato del sistema non è ottimale secondo Pareto, può avvenire uno scambio 
vantaggioso. L'esistenza dello stato ottimale garantisce, per principio, la possi- 
bilità di raggiungere una situazione economica stabile. 


1.7. Dipendenza. 


I parametri che caratterizzano un sistema fisico, economico, o di altro ge- 
nere, possono non essere indipendenti; i valori di alcuni di essi possono porre 
delle limitazioni ai valori degli altri. Se queste limitazioni sono talmente forti 
che il valore di uno di questi parametri è completamente definito dal valore degli 
altri, si ha una dipendenza funzionale. Il numero di esempi è enorme; moltis- 
sime leggi fisiche, particolarmente di «livello inferiore», sono formulazioni di 
tali dipendenze funzionali. Si è già ricordato che la temperatura 7 di un gas, 
per esempio, in un cilindro con uno stantuffo, può essere calcolata a partire dal 
suo volume V e dalla pressione f usando la formula T=cost pV. L'energia 
cinetica £ di un punto materiale con massa m, che si muova con velocità , è 
uguale a (m0°)/2. Se sulla superficie di un corpo rigido viene mantenuta co- 
stante la distribuzione della temperatura, in ogni punto concreto di questo 
corpo si stabilisce una temperatura che dipende solo da questa distribuzione. 
Sono queste le fonti dell’insieme di funzioni, o applicazioni, che appaiono nei 
modelli matematici. 


2. Applicazione quale oggetto teorico-insiemistico. 


Come si è già ricordato, nell’ambito della teoria degli insiemi la nozione di 
applicazione non è primaria; essa si forma a partire da due nozioni fondamen- 
tali: «insieme» e «essere elemento». Il prodotto X x Y consiste di tutte le cop- 
pie ordinate <x, y), dove xeX e yeY. Nella teoria degli insiemi si chiama ap- 
plicazione dell’insieme X in Y un sottoinsieme fEXXxY tale che per ogni xeX 
esiste un unico elemento yeY con la proprietà x, y)ef. 

Sul carattere degli insiemi X, Y e del sottoinsieme f CX x Y nella definizione 
non si pone alcuna limitazione a priori. In particolare X e Y non sono neces- 
sariamente insiemi numerici; possono essere, a loro volta, insiemi di applica- 
zioni, o di proprietà, oppure di queste, o di altre strutture matematiche, ecc. 
Il sottoinsieme f può essere dato con una «formula», oppure descritto mediante 
espressioni in un determinato linguaggio, ma ciò non è obbligatorio. 


Applicazioni 712 


Tuttavia, la nozione di applicazione è cosf fondamentale, che una tale ri- 
duzione delle applicazioni agli insiemi spesso non viene attuata esplicitamente. 
In questo caso un’applicazione f viene considerata come un oggetto a sé, indi- 
pendente; al posto della notazione x, y)ef si usa la notazione y=f(x), o una 
delle sue varianti (y=fx, y=x/, ecc.); l'insieme delle coppie x, y)ef tali che 
y=f(x) prende il nome speciale di grafico dell’applicazione f e può essere in- 
dicato con I’, ecc. 

Siano X, Y, Z tre insiemi e f : X-+ Y, g : Y-+Z siano applicazioni tra loro. 
A partire da esse si può costruire una terza applicazione detta composizione 
di f e g, gf: X-Z, definita dalla formula gf(x) =g(f(x)) per ogni xe X. La 
composizione di applicazioni è associativa: 4(gf)= (hg) f, quando tutti i ter- 
mini di questa uguaglianza sono definiti. Questa circostanza definisce in mi- 
sura notevole il ruolo della proprietà associativa di diverse leggi di composizione 
in algebra. Ogni insieme X è dotato dell’applicazione canonica in se stesso iden- 
tità: idy : X-X,idy(x)=x per ogni xeX. Ogni applicazione composta con essa 
non cambia: per ogni f : X- Y si ha foidy=idy of=f. 

Nel linguaggio dell’analisi classica la composizione delle applicazioni si rea- 
lizza spesso sostituendo all'argomento di una funzione i valori di un’altra fun- 
zione. Per esempio, f(x)=senlogx è la composizione delle applicazioni 
log : {numeri reali positivi}-+R e sen : R+R. La composizione è uno stru- 
mento importante per costruire funzioni sempre più complesse a partire dalle 
funzioni più semplici. È in questo modo, per esempio, che si costruisce la 
classe delle funzioni elementari a partire dalle funzioni somma, prodotto, quo- 
ziente, esponenziale, radice, logaritmo e dalle funzioni trigonometriche, ite- 
rando la composizione in modi diversi. Esse sono molto importanti nelle ap- 
plicazioni. Questa classe è sufficientemente estesa e comprende molte funzioni 
che con un buon grado di precisione modellano dipendenze e processi naturali 
e tecnologici. Come si è già ricordato, anche le funzioni calcolabili si ottengono 
per composizione a partire da un certo numero di semplici funzioni calcolabili (e 
con l'ulteriore processo speciale di ricorrenza). Nei calcoli automatici la compo- 
sizione è spesso realizzata per mezzo di sottoprogrammi: per calcolare la fun- 
zione gof uno speciale sottoprogramma calcola i valori di f e questi sono poi 
dati in ingresso al sottoprogramma che calcola g. 

Una applicazione f : X+ Y si dice monomorfa, 0 iniettiva, se, per tutti gli 
x, x, da xxx, segue che f(x,)#f(x,); epimorfa, 0 surgettiva, se per ogni 
yeY esiste xeX tale che f(x)=y; biettiva se è contemporaneamente iniettiva 
e surgettiva. 

Per esempio, l'applicazione f : R-R, f(x)=x?, non è iniettiva poiché 
f(-x)=f(x) per tutti gli x. Essa non è neppure surgettiva poiché per y<o non 
esiste x tale che x2=y. Restringendo i valori dell'argomento e della funzione ai 
soli numeri non negativi, essa diventa biettiva. Considerandola sui numeri 
complessi C l’applicazione f(x)= x? diventa surgettiva, ma non iniettiva. Se X 
è un insieme finito, l’applicazione f : X-+X può essere iniettiva solo se è sur- 
gettiva e viceversa. Infatti qui ha senso parlare del numero dei diversi valori 
dell’argomento e della funzione e, per esempio, l’iniettività significa che il nu- 
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mero di valori diversi che assume f coincide con il numero di elementi di X e, 
perciò, per ogni yeY si deve trovare un xeX tale che f(x)=y. È questo uno 
dei principî fondamentali della matematica combinatoria che studia gli insiemi 
finiti. 

. Si chiama immagine dell’applicazione f: X+ Y il sottoinsieme f(X) co- 
stituito da quegli yeY per i quali esiste xe X con la proprietà f(x)=y. Si chiama 
controimmagine di un sottoinsieme Z C Y, e s’indica conf-1(2Z), il sottoinsieme 
in X {«| f(a)e Z}. Un’applicazione f : X- Y è surgettiva se l’immagine di f 
coincide con Y; è iniettiva se le controimmagini dei sottoinsiemi di Y con un 
solo elemento sono sottoinsiemi con un solo elemento, o vuoti, di X. In una 
proiezione p del piano cartesiano Rx R su uno degli assi coordinati, come 
d(x, y)= x, la controimmagine di ogni punto x è tutta una retta. In cartografia, 
per rappresentare il rilievo della superficie terrestre sul piano della carta, si 
usano le linee di livello: queste linee sono le controimmagini dei diversi va- 
lori della funzione 4 : (regione terrena rappresentata)+ (numeri reali) che dà 
l’altezza del punto dato sul livello del mare. Per analogia spesso si parla d’in- 
siemi di livello di una data funzione, intendendo con ciò le controimmagini 
f?(y) per i diversi yeY. 

Ogni applicazione f : X+ Y induce su X una relazione di equivalenza bi- 
naria E; CX x X, che consiste di tutte quelle coppie ordinate ‘x, x)E XxX 


‘ per le quali f(x,)=f(x,). Essa soddisfa i tre assiomi generali della relazio- 


ne di equivalenza: x, x)e E, per ogni x (riflessività); se Cx,, x)€ £,, anche 
KxX9, x,)€ E; (simmetricità); se x,, x)€ E; e (xa, x3)€ E, anche <x,, x3)€ E, 

(transitività). S’indica con X/E, l'insieme i cui elementi sono le classi di equi- 
valenza di X rispetto a E;, cioè i sottoinsiemi massimali di X costituiti dagli 
elementi equivalenti tra loro. È definita l'applicazione s, : X-+X/E;, dove 
5p(x) = classe di equivalenza contenente x, e cosf pure l'applicazione i; : X/E;> Y, 
dove i;(classe di x) =f(x)e Y. L'applicazione s; è surgettiva, mentre î; è iniet- 
tiva; per ogni applicazione f si ha sempre la scomposizione f=1,s; nella com- 
posizione di un’applicazione surgettiva e una iniettiva. 

Le applicazioni canoniche sono legate a diverse costruzioni teorico-insiemi- 
stiche. Per esempio, il prodotto cartesiano X x Y è applicato surgettivamente 
sui suoi fattori mediante le proiezioni pfpy : Xx Y>X e pr: Ax Y+Y, dove 
dx(a, J)=x e py(x, y)=v. Sia ora Z un insieme qualsiasi e consideriamo le 
due applicazioni fy : Z+X e fy : Z+Y. Esiste allora un’unica applicazione 
f:Z+XxY per la quale fy=pyxf e fy=py f. È, questo, un esempio tipico 
della universalità della costruzione (Xx Y; px, py); si vedano gli esempi suc- 
cessivi. 

. Nella matematica classica si usano spesso delle generalizzazioni della no- 
zione di applicazione; si tratta delle cosidilette applicazioni parziali e di quelle 
a più valori. 

Un’applicazione parziale dell’insieme X nell’insieme Y è un’applicazione 
f: D-+Y, dove DCX è un certo sottoinsieme di X non necessariamente coin- 
cidente con tutto X. Per esempio, la funzione f(x)= 1/x da R in R non è defi- 
nita, con questa formula, nel puntò x=o e, pertanto, è solo un’applicazione 
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parziale di R in R. Se f è un’applicazione parziale di A in Y, definita sul sot- 
toinsieme DC X, si dice spesso che f ha delle singolarità nel complemento 
X\D. Questa terminologia si assume solitamente quando X\D è piccolo 
rispetto a D, per esempio quando consiste di un numero finito di punti in un 
dominio numerico, e quando nelle approssimazioni xe D ai punti di X\D 
si rivelano delle irregolarità nel comportamento della funzione. In generale la 
nozione di singolarità di una funzione, o applicazione, usata per le diverse 
classi di funzioni, si concretizza in modi diversi e non è necessariamente legata 
all’indeterminatezza della funzione nelle sue singolarità. Esempi tipici di sin- 
golarità nei modelli matematici sono forniti dai momenti del tempo nei quali un 
processo si sviluppa a salti (discontinuità, ecc.); dai punti dello spazio ove si 
ha l'origine dei campi (gli elettroni nella teoria del campo elettromagnetico). 

Un’applicazione a più valori dell'insieme .X nell’insieme Y è una appli- 
cazione A+ 9(Y), dove P(Y) è l'insieme di tutti i sottoinsiemi di Y. Se 
f(x)=Z<Y, intuitivamente f associa ad xe X molti valori: tutti i possibili 
elementi ze Z. Un tipico esempio di funzione a più valori è la «funzione» 
f(a)= Vx dai numeri reali positivi a R: essa assume due valori in ogni punto 
xx#0, È, questo, un caso particolare di uno schema generale sul modo di for- 
mare funzioni analitiche a più valori in una variabile complessa. Se una fun- 
zione è data in un intorno di un punto nel piano complesso mediante una 
serie di potenze, il processo del suo prolungamento analitico, che consiste nel- 
l’assegnarla mediante serie diverse in una catena di domini intersecantisi, può 
condurre a un valore diverso di questa funzione nel punto iniziale, quando la 
catena di domini si chiude su se stessa. In questo processo si possono anche 
individuare punti d’indeterminatezza della funzione. Pertanto, a partire da una 
funzione iniziale in un piccolo dominio, si giunge a una funzione da C'in C (nu- 
meri complessi), la quale in generale è a più valori e parziale. Cosî, per esempio, 
la funzione log x da C in C non è definita nel punto x=o0 (e solo in esso) 
e, perogni x350, assume un insieme numerabile di valori, {logy x+2rV-1 n}, 
dove n varia tra tutti i numeri interi, mentre log, x è uno di questi valori. Affin- 
ché questa funzione diventi un'applicazione ad un solo valore, bisogna cam- 
biare il suo dominio di definizione. Questo importante processo è stato ap- 
plicato la prima volta da B. Riemann [1851] e ha condotto alla fondamentale 
nozione di superfici di Riemann e, più tardi, alla nozione generale di «varietà 
complesso-analitiche » (cfr. oltre). L’uso sistematico delle applicazioni parziali 
ha condotto negli ultimi decenni all'importante formalismo della teoria dei fa- 
sci (cfr. oltre). 

In matematica hanno un maggiore significato non già le applicazioni arbitra- 
rie d’insiemi, ma le applicazioni che concordano con queste o quelle strutture 
su essi. Però, prima di passare a descrivere degli esempi, è bene dire qualcosa 
sulla teoria delle potenze degli insiemi di G. Cantor [1879-83], dove la no- 
zione di applicazione è apparsa per la prima volta nella sua forma «pura», con- 
sentendo in tal modo di porre tutto un complesso di difficili problemi mate- 
matici e filosofici. 
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Prima di tutto, la nozione di applicazione permette di formulare nel linguag- 
gio della teoria degli insiemi la definizione esatta d’insieme finito. Un insieme 
X si dice finito (secondo Dedekind) se ogni sua applicazione iniettiva in se stesso 
è contemporaneamente surgettiva. Intuitivamente il senso di questa definizione 
è già stato chiarito: se un’applicazione f non incolla degli elementi, cioè, se la 
relazione di equivalenza £, è l’identità, l’immagine f(X) deve contenere tanti 
elementi quanti ne contiene .X e perciò non può essere strettamente minore di 
X. Questo ragionamento perde significato per insiemi infiniti X (che cosa si- 
gnifica «tanti elementi quanti» ?) e, infatti, l’applicazione f : Z+Z, f(x)=2%, 
dell'insieme dei numeri interi in se stesso è iniettiva, ma non surgettiva. Tale 
«paradosso dell’infinito » — «il tutto è uguale a una sua parte» - si discuteva da 
molto tempo e Dedekind propose [1888] di considerarlo semplicemente quale 
definizione dell’infinito nell’universo degli insiemi. (Negli ultimi tempi un 
paradosso analogo si è incontrato nella fisica delle particelle elementari. Un 
nucleone può generare una coppia virtuale nucleone-antinucleone e, se si tenta 
di ritenere i termini di questa coppia quali parti del nucleone, bisogna ricono- 
scere che il nucleone contiene una sua parte propria isomorfa a se stesso. Per molti 
versi le particelle elementari vanno considerate quali «infiniti fisici»). 

Fino a Cantor, però, non era noto che anche gl’insiemi infiniti si prestano 
a un confronto rispetto alla loro grandezza. A Cantor risale la serie seguente 
di definizioni. Due insiemi, X, Y, si dicono equipotenti se esiste un’applicazione 
biettiva f : X-+ Y (0, ciò che è lo stesso, una biezione g : Y+X). In questo 
caso scriveremo card X=card Y. Scriveremo card X<card Y se X è equi- 
potente a un sottoinsieme di Y. Diremo che X e Y sono confrontabili se 
card X<card Y, oppure card Y<card X. Infine, scriveremo card X<card Y 
(la potenza di X è minore della potenza di Y) se card X<card Y, ma non 
è vero che card X=>card Y. 

Dagli assiomi di Zermelo-Fraenkel si può dedurre il seguente teorema di 
Cantor-Schròder-Bernstein-Zermelo: 


a) ogni due insiemi sono confrontabili; se contemporaneamente card X<card Y 
e card Y<card X, allora card X= card Y; 

b) sia P(X) l'insieme di tutti i sottoinsiemi di X; allora card P (X)> card X; 

c) per ogni proprietà degli insiemi esiste un insieme di potenza minima con 
questa proprietà (se questi insiemi esistono in generale). 


Pertanto le potenze degli insiemi sono linearmente ordinate (cfr. oltre); la 
massima potenza non esiste; infine le potenze degli insiemi sono completamente 
ordinate. Queste proprietà della scala delle potenze furono scoperte da Can- 
tor, benché alcune di esse siano state dimostrate più tardi. 

La scala delle potenze comincia con i numeri interi non negativi 0, I, 2, 3,..., 
che possono essere definiti quali potenze degli insiemi finiti [Whitehead e Rus- 
sell 1962]. La prima potenza infinita è quella dell’insieme N= {o, 1, 2,3, ...} 
dei numeri interi non negativi, la cosiddetta potenza numerabile @©y, oppure 
S,. La potenza infinita successiva strettamente maggiore, che si può costruire 
con il metodo di Cantor, è la potenza dell'insieme 4(N). Essa si chiama po- 
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tenza del continuo e si indica con 2% in analogia con il caso degli insiemi 
finiti: se X contiene n elementi, P(X) contiene 2” elementi. 

Il fatto che la potenza di P(N) sia strettamente maggiore della potenza di 
N si dimostra con il famoso processo di diagonalizzazione di Cantor. Infat- 
ti, N è biettivo con la parte di P (IN) costituita da tutti i sottoinsiemi con un 
solo elemento, {n}, dove ne N. Se N fosse biettivo con tutto P(N), dovrebbe 
esistere una applicazione f : N-+9(N) con immagine 9(N). Mostriamo che, 
per ogni f, l’immagine di f non può coincidere con (N). Infatti, indichiamo 
con MEN il sottoinsieme di N (eventualmente vuoto), costituito da tutti i nu- 
meri m tali che méf(m). Supponiamo che M=f(m) per un opportuno my N 
e giungeremo a una contraddizione. A questo scopo consideriamo la posizione di 
mo rispetto ad M. Se me M, in forza della definizione di M, méf(my), cioè 
mo M, poiché f(m)=M; questa è una contraddizione. Se, invece, moé M, 
essendo f(my)=M, risulta my€f(mo), ma allora me M per definizione di M; 
si ha di nuovo una contraddizione. Ciò dimostra il teorema di Cantor. È evi- 
dente che non si è mai usato il fatto che N sia l'insieme {0, 1, 2, ...}, cosf che la 
dimostrazione e il risultato sono applicabili ad ogni insieme al posto di N. 

La questione relativa all'esistenza di potenze intermedie tra &%y e 2°, che si 
pone in modo naturale nell’ambito di queste idee, si chiama «problema del 
continuo ». Dopo prolungati sforzi fu scoperto che l’ipotesi di Cantor, secondo 
la quale non vi sono potenze intermedie, è indipendente dagli altri assiomi della 
teoria degli insiemi. Il potente metodo per la dimostrazione dell’indipendenza, 
ideato da P. Cohen [1966], condusse a stabilire l’indipendenza di tutta una 
serie di altre affermazioni nella teoria degli insiemi, che si possono interpretare 
quali insolubilità di una serie di problemi relativi all’esistenza di applicazioni 
d’insiemi infiniti, con proprietà di questo o di quel tipo, nell’ambito dell’assio- 
matica assunta. 

Tuttavia, la logica interna dello sviluppo della matematica e le esigenze delle 
scienze naturali, nella maggioranza dei casi, inducono a considerare non già 
qualsiasi applicazione, ma solo quelle che concordano con queste o quelle 
strutture (cfr. il paragrafo seguente). 


3. Applicazioni dî strutture matematiche. 


In questo paragrafo si riporterà la descrizione di alcune fondamentali strut- 
ture matematiche e si chiarirà come si possa legare con ogni struttura su un 
dato insieme una classe di applicazioni di questo insieme che concordino con la 
struttura data. 


3.1. Struttura di ordinamento. 


Sia X un insieme. Un sottoinsieme R CX x X si chiama relazione binaria 
R su X. Al posto di x, y)e R, per x, ye X, spesso si scrive xRy. Una rela- 
zione binaria < su X definisce una struttura d’ordinamento se da x<y e y<x 


Seni 
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segue che x=y e se da x<y e y<z segue che x<2 (transitività). Il più noto 
esempio di struttura di ordinamento è l’ordinaria relazione di disuguaglianza 
(non stretta) sui numeri reali, razionali, o interi; essa motiva la scelta della 
notazione generica < per la relazione di ordinamento sugli insiemi astratti. 
Un altro esempio è la relazione < sull’insieme P (X) dei sottoinsiemi di X. Un 
terzo esempio è la relazione card x<card y su un certo insieme di potenze di 
insiemi. Nella nostra descrizione del modello di puro scambio in economia 
matematica ($ 1.6) ogni funzione di utilità u; : P+R definisce una certa 
struttura di preordinamento <; sull’insieme P degli assortimenti di merci: 
(2x1, €) (A, 7) Se wi(%1, .., x) <U;(A1, ..., x), ma può non valere 
il primo assioma. Le strutture <;, in generale, non coincidono. Non è diffi- 
cile vedere che solo queste strutture sono essenziali nello studio dell’esi- 
stenza dello stato ottimale secondo Pareto; se si cambia %; in modo da non 
cambiare <; (per esempio, se, invece di w;, si prende cu; con c;>o), l'insieme 
degli stati ottimali non cambia. Vale la pena di notare che la validità reale di 
una congettura sulla transitività di una relazione di utilità <; è problematica: 
sono noti esperimenti nei quali un essere sottoposto a tre stimoli, X,, Xx, X, 
preferisce X, allo stimolo X,, X, allo stimolo X3, ma preferisce X, allo stimo- 
lo X,. Comunque sia, in una serie d’indagini sociali e psicologiche le strutture 
di ordinamento appaiono in modo naturale nelle seguenti circostanze. Posto che 
C’interessi l’intensità di questo o quel segnale di un fenomeno, allora accade 
spesso che si sia in grado di stabilire, per ogni coppia di fenomeni, a quale di 
essi corrisponda un segnale più intenso, il che conduce a una struttura di or- 
dinamento. La tendenza a descrivere in ogni caso questa intensità quantita- 
tivamente, cioè di stimarla con una funzione numerica, potrebbe portare ad 
introdurre un inutile elemento arbitrario non richiesto dall’essenza dei fatti. 

Un insieme XY con su esso una struttura di ordinamento si dice insieme 
ordinato. Un’applicazione f : X-+ Y di due insiemi ordinati si dice monotona 
se da x} <x, in X segue che f(x;)<f(xs) in Y. Nell’esempio con le funzioni 
di utilità l'applicazione u; : P>.R è monotona rispetto al preordinamento <; 
su P e all’ordinaria disuguaglianza su RR. 

Qualche volta appare utile considerare applicazioni strettamente monotone 
d’insiemi ordinati. Sia X un insieme con una relazione di ordinamento <. 
Introduciamo una nuova relazione < su X: scriveremo x,<%xg se x; <x,, ma 
x17%x,. Un’applicazione f : X+ Y si dice strettamente monotona se da x, <x; 
segue che f(x,)</(x:). La funzione f(x)=Ax da R in RR è strettamente mono- 
tona per &4>o e solamente monotona per &=0. Ecco ancora un esempio: 
siano YCX un insieme e un suo sottoinsieme. L'applicazione P(X)+P(Y), 
che ad ogni sottoinsieme Z < X associa la sua intersezione con Y, è monotona 
rispetto alla relazione S su P(X) e P(Y). Se Y#X, essa non è strettamente 
monotona. 

Le applicazioni monotone e strettamente monotone sono gli esempi più 
semplici di applicazioni che concordano con le strutture. Passiamo ad altri 
esempi. 
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3.2. Strutture algebriche. 


Le strutture algebriche sono quelle definite dalle diverse leggi di compo- 
sizione. Sia X un insieme. Si chiama legge di composizione interna binaria su X 
ogni applicazione f : Xx X-+X. Esempi: X= R, oppure Z, f(x, y)=x+y, op- 
pure xy; oppure X=(Y), f(x, y)=xUy, oppure xNy. In questi esempi f 
soddisfa la seguente condizione di associatività: f(f(x,y), 2)=f(x, f(v, 2)) 
per tutti gli x, y, 2. Un insieme X con una legge di composizione interna 
associativa si chiama monoide. Tale legge di composizione spesso si indica con 
l’ordinaria notazione di prodotto, scrivendo xy al posto di f(x, y). Se X, Y 
sono due monoidi, un’applicazione g : X+ Y si chiama omomorfismo di mo- 
noidi quando g(x,x,)=£(x;)g(x») per tutti gli x,, x,e XY. In altre parole, g deve 
concordare con le leggi di composizione su X, Y. 

Sia X un monoide. Un elemento ee X si chiama unità (bilatera), se 
ex=%xe=x per ogni xe X. Una applicazione i : X+X si chiama inversione (bi- 
latera), se #(x)x= xi(x)=e per ogni xe X. AI posto di i(x) spesso si scrive x. 
Un monoide X con la sopraindicata unità ee X e con l'applicazione i : x+x-! 
si chiama gruppo. Siano X, Y due gruppi. Un’applicazione f : X+ Y si chiama 
omomorfismo di gruppi se essa è un omomorfismo di monoidi che applica l’unità 
di X nell’unità di Y e se f(x-1)= f(x)! per ogni xe X. Un monoide, o un gruppo, 
X si dice commutativo se xy =yx per tutti gli x, ye X. 

L’insieme R* dei numeri reali positivi è un gruppo commutativo con il pro- 
dotto quale legge di composizione, con l’unità 1 e l’inversione i(x)= x. L’in- 
sieme R di tutti i numeri reali è un gruppo commutativo con la somma quale 
legge di composizione, con l’unità o e l’inversione (x) = —«. L'applicazione 
log : R*+R è un omomorfismo di questi gruppi. Essa, inoltre, è biettiva: tali 
applicazioni si dicono «isomorfismi ». } 

Un esempio di gruppo non-commutativo è l'insieme S(X) di tutte le appli- 
cazioni biettive di un certo insieme X in se stesso, cioè le permutazioni di X. 
Qui la composizione è la composizione delle applicazioni, l'applicazione iden- 
tica x+x è l’unità. L’applicazione inversa f-! è definita cosi: se f(x)=y, 
f2(0y)=x. Il gruppo S,=.S({1, ..., x}) si chiama gruppo simmetrico di 
n-esimo grado. Per = 3 esso non è commutativo. Ad ogni elemento se $S, può 
essere associato il numero +1, oppure — 1, cosicché questa applicazione diventa 
l'’omomorfismo e : S,+{1, —1} (il secondo è un gruppo con il prodotto quale 
legge di composizione). L’omomorfismo e è definito univocamente dalla con- 
dizione e(s)= —1 se s cambia posto esattamente a due numeri e lascia gli al- 
tri al loro posto. 

I gruppi e i loro omomorfismi hanno un’importanza fondamentale nella ma- 
tematica e nella fisica moderne. In particolare, essi forniscono i modelli fon- 
damentali per la descrizione delle simmetrie degli oggetti, dei fenomeni e delle 
leggi della natura. 

Gli esempi successivi di strutture algebriche sono i corpi e gli anelli. Un in- 
sieme K si chiama corpo se su esso sono date le seguenti strutture: a) la strut- 
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tura di gruppo commutativo con legge di composizione + e l’unità o su tutto 
K; 8) la struttura di gruppo commutativo con unità 1 e legge di composizione 
«prodotto»: (x, y)->xy sull’insieme K*=K\ {o}; e y) queste strutture sono 
legate dalla legge distributiva x(y+z)=xy+2 per tutti gli x, y, zeX. Se in 
8) si richiede che XK sia, rispetto al prodotto, solo un monoide, si ottiene la 
struttura di anello. 

I numeri razionali Q, i numeri reali R e i numeri complessi C forniscono 
gli esempi più noti di corpi. La nozione generale di corpo assiomatizza quelle 
proprietà di natura puramente algebrica. Esistono corpi con un numero finito 
di elementi; i cosiddetti «corpi di Galois». L'esempio più semplice di tali corpi 
è {o, 1}, con le leggi di composizioneo+o0=1+1=0;0+1=1}0-0=0-1=0; 
I-1=1. Questo corpo e corpi più generali di Galois sono largamente usati nei 
moderni dispositivi per la trasmissione di dati e per l'elaborazione delle infor- 
mazioni, dove sulla loro base sono progettati diversi sistemi di codificazione. 
Un’applicazione f : K+L di due corpi si chiama omomorfismo se essa è con- 
temporaneamente un omomorfismo di K in L rispetto alla somma e di K* in 
L* rispetto al prodotto. Si può dimostrare che ogni omomorfismo di corpi è 
necessariamente iniettivo. Gli omomorfismi dei corpi sono studiati nella teo- 
ria di Galois e in geometria algebrica. 

Siano K un corpo ed E un gruppo commutativo con la legge di compo- 
sizione indicata con + come in K e con l’unità o come nel gruppo additivo K. 
La struttura sul gruppo E di spazio vettoriale, o lineare sopra K è definita da una 
legge di composizione esterna K x E+ E. L'immagine della coppia <k, e), dove 
ke K, ec E, in questa applicazione s'indica ke. Quest’applicazione deve soddi- 
sfare una serie di proprietà; in particolare, (R1-+k,)e=R,e+kse, k(e1t+-e,) = 
= Re\+kes, (Riks)e=R,(kse) per tutti i k, ky, AEK; e, e, GEE. 

L'esempio più semplice di spazio lineare sopra K è il gruppo E= K*=Kx 
X...XK (n volte), costituito dalle n-uple (k,, ..., &,). La legge di compo- 
sizione interna in E è: (k,, ..., Rn) + (AL, +, RA) = (A1+A5, ., An +). La 
legge di composizione esterna è: k(ki, ..., &,)= (RA, ..., Rk,). Pit complessi 
e molto importanti nelle applicazioni sono gli spazi funzionali. Per esempio, 
lo spazio E delle funzioni da R in R è dotato della struttura di spazio vet- 
toriale sopra R con le leggi (f+2)(x)=f(x)+£(x) per tutte le f, ge E e per 
ogni xe R e (cf)(x)=cf(x) per ogni ce R, fe E, xe R. 

Siano E,, E, due spazi lineari sopra il corpo K. Un’applicazione / : E,> E, 
si chiama applicazione lineare, o (omo)morfismo di questi spazi se essa è un 
omomorfismo di gruppi e, inoltre, se concorda con il prodotto esterno nel 
senso che è Z(ke)= (le) per ogni Re K, ec E. Un'applicazione lineare di uno 
spazio E in se stesso si chiama operatore lineare su esso. 

La nozione di applicazione lineare investe una parte notevole della mate- 
matica moderna e delle sue applicazioni. Essa è a fondamento di tutta l’ana- 
lisi. La derivazione delle funzioni è un’operazione lineare; la sostituzione di 
piccole variazioni di una funzione con approssimazioni lineari è un principio 
generale nei modelli matematici, straordinario per la sua universalità e per la 
sua efficacia. L'integrazione delle funzioni è pure un’operazione lineare; la sua 
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base naturale è l’esistenza di un insieme di caratteristiche fisiche del tipo mi- 
sura (area, volume, massa, energia), che sono additive quando due sistemi si 
riuniscono in uno e che, quando si cambia l’unità di misura, si comportano in 
modo naturale. Infine, la linearità dell'apparato matematico fondamentale della 
meccanica quantistica classica è basata sul principio della superposizione degli 
stati, la cui stessa formulazione sarebbe stata impossibile senza una preliminare 
individuazione matematica dell’arco di nozioni descritte. La stessa cosa si può 
dire della nozione dell’operatore lineare di una data grandezza fisica esaminata 
nel $ 1.5. 

Se gli stati di un dato sistema sono descritti da uno spazio lineare E, il 
gruppo G delle simmetrie di questo sistema è dotato di un omomorfismo di G 
nel gruppo degli operatori lineari biettivi su E. Questo omomorfismo si chiama 
rappresentazione lineare del gruppo G. Le rappresentazioni lineari formano 
una ricca classe di strutture ben studiate. Per esempio, l'atomo di un qual- 
siasi elemento è dotato di un gruppo naturale di simmetrie, cioè le rotazioni dello 
spazio attorno al nucleo dell’atomo. Risulta che le caratteristiche matematiche 
di diverse rappresentazioni di questo gruppo possono essere identificate con una 
serie di caratteristiche sperimentali degli elementi; in una certa approssimazione 
la tabella di Mendeleev può essere persino considerata quale tabella degli in- 
varianti di diverse rappresentazioni del gruppo di rotazioni. 


3.3. Spazio con misura e flussi. 


Consideriamo il moto di un liquido in un certo volume; per esempio, il 
flusso dell’acqua nel letto di un fiume. Con buona approssimazione si può ri- 
tenere l’acqua incomprimibile. Seguiamo il moto di un certo volume d’acqua; 
per esempio, di una sfera di raggio 1 centimetro, individuata al momento ini- 
ziale nel flusso generale. Dopo un intervallo di tempo, diciamo di 1 secondo, 
essa si è mossa in basso lungo la corrente e si è deformata, ma il suo volume 
è rimasto lo stesso. Tali generi di fenomeni sono matematicamente modellati 
con le nozioni di «spazi con misura», di «applicazioni che conservano la misura» 
e di «flussi». 

Si chiama spazio con misura un insieme X nel quale sia individuato un 
certo sottoinsieme S TP (X), cioè i sottoinsiemi misurabili di X, e sia data una 
funzione p. : S+> {numeri reali non negativi}. Per ogni insieme misurabile 
Ye S il valore u(Y) si chiama misura di Y. L’insieme S deve essere chiuso 
rispetto alle intersezioni e alle unioni numerabili dei suoi elementi, mentre 
la misura p. deve godere della proprietà additiva: la misura dell’unione di un 
insieme numerabile di elementi di S, a due a due disgiunti, è uguale alla somma 
delle misure di questi elementi. Nell'esempio del flusso del liquido, u(Y) è 
semplicemente il volume di Y. 

Un’applicazione 7 : XX conserva la misura se, per ogni insieme misura- 
bile YCX, l'insieme T(Y) è misurabile e u(7(Y))=u(Y). Si considererà qui 
solo il caso in cui 7 è biettiva e tutte le potenze di T conservano la misu- 
ra. Un flusso su X è un insieme {T,} di applicazioni che conservano la misura, 
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indicizzate con i «momenti del tempo» teR e tali che T,,0T,,=7,,,,- Nel 
caso del flusso di un liquido 7 applica la posizione di ogni particella del li- 
quido al momento o nel luogo che essa occupa al momento # (l’insieme X è 
l'insieme dei punti del volume di liquido). 

Le applicazioni che conservano la misura sono un altro esempio di appli- 
cazioni che concordano con le strutture. 

Il ruolo di tali applicazioni nella fisica non è limitato all'esempio riportato 
all’inizio di questo punto. Il fatto è che, per una classe estesa di sistemi fisici che 
si evolvono nel tempo, nel loro spazio delle fasi esiste una misura invariante 
rispetto al flusso di questa evoluzione (teorema di Liouville per i sistemi ha- 
miltoniani). Un esempio può essere il sistema solare, oppure, in una certa ap- 
prossimazione, il sistema di molecole in un dato volume di gas. (Qui lo spazio 
delle fasi non coincide affatto con lo spazio occupato da questo volume; si tratta 
di uno spazio astratto, ogni punto del quale è costituito dall’insieme delle coor- 
dinate e delle velocità di tutte le molecole. La sua dimensione è molto grande; 
in condizioni normali 1 cm? di gas contiene circa 10°° molecole). Dalla conser- 
vazione della misura segue l’importante teorema di Poincaré: nell’evoluzione di 
un tale sistema, ‘per quasi ogni stato iniziale, il sistema ritorna infinite volte a 
uno stato arbitrariamente vicino a quello iniziale. In particolare, se inizialmente 
tutto il gas era concentrato in una metà del volume, per esempio, diviso da una 
paratia, dopo che questa sia stata tolta, il gas, essendo lasciato a se stesso, si 
raccoglierà da solo infinite volte in quella metà del volume. La contraddizione 
di questa deduzione con la pratica dell’uomo si chiama, nei fondamenti della 
meccanica statistica, paradosso di Zermelo. Di solito esso viene risolto osser- 
vando che il tempo medio per tornare alla posizione iniziale in questo caso è 
cosî grande da superare tutto il tempo dell’esistenza dell'Universo. Ciò è le- 
gato all'enorme dimensione dello spazio delle fasi. Osservando il moto brow- 
niano di una singola piccola particella, ci si può convincere del suo ritorno 
periodico in un intorno della posizione iniziale. 

Ancora un’altra importante applicazione nella fisica statistica delle appli- 
cazioni con misura invariante è legata ai cosiddetti teoremi ergodici. Essi mo- 
tivano la coincidenza di medie «spaziali» e «temporali», cioè di diverse carat- 
teristiche di un sistema, mediate rispetto al tempo della sua evoluzione, e di 
queste stesse caratteristiche, mediate rispetto a tutti i possibili stati del sistema 
in un fissato momento del tempo. 


3.4. Continuità. 


Una funzione r : R(tempo)+R(distanza) che descriva il moto di un punto 
materiale gode della proprietà che le distanze in due punti vicini nel tempo 
sono pure vicine tra loro. In generale la maggioranza delle funzioni che mo- 
dellano processi naturali è tale che piccole variazioni dei valori dell'argomento 
comportano piccole variazioni dei valori della funzione. Ciò conduce all’idea di 
continuità. (Costituiscono un’importante eccezione i domini singolari dello 
sviluppo di un processo, dove piccole variazioni dei parametri conducono a va- 
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riazioni molto rapide delle caratteristiche del processo: i modelli matematici di 
tali fenomeni forniscono la teoria delle singolarità di diversi generi, dei quali 
si tratterà in seguito in modo più particolareggiato). 

Una precisazione di queste idee conduce alla seguente definizione classica 
di funzione continua: una funzione f : R>R si dice continua nel punto xe R 
se, per ogni n>o, esiste e>o tale che, per |x — xo <5, abbiamo f(x) -f(«)|<": 
la variazione della funzione diventa piccola a piacere, se la variazione dell’ar- 
gomento è sufficientemente piccola. 

Questa definizione si estende evidentemente alle funzioni a valori reali in più 
argomenti reali, alle funzioni in variabili complesse, alle funzioni-vettori, ecc. 

Un'analisi ulteriore della nozione di continuità conduce a suddividerla in 
due nozioni: una si riferisce alla presenza di certe caratteristiche di «vicinanza» 
fra i punti del dominio X e del codominio Y dell’applicazione, cioè alle to- 
pologie su X e su Y; l’altra, alla conservazione di questa vicinanza in una 
applicazione continua. Nelle situazioni classiche il problema della topologia in 
R non nasce poiché esso entra a far parte delle proprietà usuali dei numeri reali. 

La nozione generale di spazio topologico, cioè di un insieme con una to- 
pologia, è la seguente: si chiama spazio topologico una coppia (X, T), dove 
TC9(X) è un certo insieme di sottoinsiemi di X, detti sottoinsiemi aperti di X., 
che soddisfa i seguenti assiomi: 


T,)) dET e XeT; 

T,) per ogni punto xe X esiste un insieme Ue T tale che xe U. [L'assioma 7, 
è conseguenza di 7,, ma in questo contesto e per il seguito è utile in- 
dicare esplicitamente questa proprietà]; 

Ty) l'intersezione di ogni insieme finito di elementi di T è un elemento di T; 

T3) l’unione di ogni insieme di elementi di T è un elemento di T. 


Per esempio, nell’ordinaria topologia di R gli insiemi aperti sono esatta- 
mente quegli insiemi U CR che, se contengono il punto xe R, contengono l’in- 
tero intervallo (x—e, x+e) CU se e è sufficientemente piccolo. Analogamente, 
nell’ordinaria topologia dello spazio a x dimensioni R”, un insieme U CR” è 
aperto se, e solo se, per ogni punto <x,, ..., x,)e U, esiste un e>Oo tale che, 
per lx gl <8, .. [8 US si ha (yy, ..., Pe U. 

In generale, siano (X, Ty) e (Y, Ty) due spazi topologici. Un’applicazione 
f:X-+Y si dice continua, o «morfismo di spazi topologici», se, per ogni in- 
sieme aperto Uye Ty, si ha f/1(Up)e Ty. 

Dietro queste definizioni sono le seguenti considerazioni intuitive. La vici- 
nanza dei numeri x, y di R è misurata dalla distanza tra loro, cioè dalla gran- 
dezza jx—y|; però questo non è il modo più generale per introdurre la vici- 
nanza, poiché è troppo strettamente legato alle idee usuali sulla retta reale. In- 
vece, in generale basta limitarsi a dichiarare quali insiemi di punti debbano 
ritenersi «sempre più vicini) a un punto x, e un’idea adeguata di ciò viene 
data dal «sistema di intorni aperti» di x, cioè dagli insiemi aperti Ue 7 che con- 
tengono x. Un’applicazione f : X- Y è continua se punti vicini di X possono 
capitare solo in punti vicini di Y 
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La maggior parte degli spazi topologici, che nell’analisi si presentano in modo 
naturale, soddisfano una condizione supplementare, il cui significato intuitivo 
consiste nel fatto che due punti distinti non possono essere «infinitamente vi- 
cini». Essa è formulata con espressioni diverse, più o meno forti, tra le quali 
la più usata è 


T;) (assioma di separabilità di Hausdorff): per ogni due punti x,, xy X, 
x,75%,, esistono U,, Use T tali che xe U,, xe U, e UMNU,= @. 


Le applicazioni continue di spazi separabili secondo Hausdorff sono dotate 
di molte proprietà che sono naturali per le funzioni classiche continue. 


3.5. Varietà topologiche. 


Fra i diversi spazi topologici sono particolarmente importanti gli spazi vet- 
toriali R” e C" e gli spazi che localmente (in un intorno sufficientemente pic- 
colo di ogni loro punto) sono strutturati in modo simile a R", o C®. 

Per formulare esattamente questa definizione introduciamo la nozione di 
«omeomorfismo ». Si chiama omeomorfismo di due spazi topologici X, Y un’ap- 
plicazione biettiva continua f : X+Y tale che l’immagine di ogni insieme 
aperto in X è aperta in Y e la controimmagine di ogni insieme aperto in Y è 
aperta in X (quest’ultima condizione segue dalla continuità di f). Per esem- 
pio, tutti gli intervalli aperti in R sono omeomorfi tra loro: l’omeomorfismo 
(a, b)- (0, 1) è dato dall’applicazione f(x)=(x—a)/(5—a). Essi sono pure 
omeomorfi a tutta la retta R: l’omeomorfismo (0, 1)-+R è dato dall’applicazione 
Î(x)=log log 1/x. Analogamente si può dimostrare che tutte le sfere aperte in 
R" sono omeomorfe tra loro e a tutto A”. 

Uno spazio topologico X si chiama varietà (ad n dimensioni) se, per ogni 
punto xe X, esiste un suo intorno aperto U omeomorfo a R”., Qui si sottintende 
che la topologia su U è definita dall’insieme di quei sottoinsiemi di U che sono 
aperti quali sottoinsiemi di X, cioè la topologia su U è indotta dalla topologia 
di X 

Nella fisica moderna sono di importanza fondamentale le varietà a quattro 
dimensioni, cioè i modelli matematici dello spazio-tempo. Il modello classico 
di Newton risponde allo spazio-tempo R*= «spazio fisico » x «asse del tempo». 
Nel modello della teoria ristretta della relatività di Einstein lo spazio resta 
omeomorfo a R' (e conserva persino la struttura lineare), ma l’asse del tempo 
perde la sua posizione individuale. Infine, nei modelli della teoria generale della 
relatività lo spazio-tempo può appartenere ad una classe molto generale di va- 
rietà a quattro dimensioni che solo «in piccolo» conservano le proprietà di RÉ. 


3.6. Varietà differenziabili. * 


Lo spazio R" è dotato in modo naturale di una struttura complementare che 
è data dall’insieme di tutte le funzioni R" + R differenziabili rispetto a tutti gli ar- 
gomenti. Una funzione f(x,, ..., x) si dice differenziabile in un intorno del 
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punto (x, ..., x0) se in questo intorno f può essere ben approssimata da una 
i ; d 

funzione lineare: f(x, ..., %n) =f(%; De <a) +h (e) +. 4/1 (nt 

+ (termini infinitesimi d’ordine superiore rispetto a max (|x, tl, .-., le -261)); 

qui f/ sono costanti dipendenti da (x9, ..., x0). Se la funzione f è differenziabile 

in un intorno di ogni punto di R”, essa si dice semplicemente differenziabile. 

In questo caso il coefficiente f{, considerato quale funzione di (x9, ..., x0), si 

indica 

of :R"+R 

dx; 


e si chiama derivata parziale di f rispetto a x;. Ripetendo questo processo si 
definiscono le derivate superiori 


of _d(0df 
dx; dx; dx;\ dx; 


e cost via. Se sono definite tutte le derivate 


dif 


dxi... Oxin 


per i+... +i,=i<m, la funzione f si dice m volte differenziabile. Una fun- 
zione differenziabile m volte per ogni m si dice infinite volte differenziabile, o 
liscia. 

Sia X una varietà topologica ad n dimensioni. Un’applicazione f : R"->X 
che definisca un omeomorfismo di R” con un insieme aperto UCX si chiama 
carta su X. In questo caso ogni punto xe U può essere dato dalle coordinate del 
punto /74(x) in R*; in questo senso assegnare le carte equivale ad assegnare 
su X un sistema locale di coordinate. Supponiamo che siano date due carte 
f:R->X,g:R">X, f(R")=U, g(R")=V. Allora nell’intersezione UNIV 
sono definiti due sistemi locali di coordinate; uno definito da f e l’altro definito 
da g. Esprimiamo le g-coordinate di un punto xe UNV mediante le sue f- 
coordinate: ciò fornisce un sistema di x funzioni in x variabili definito nel domi- 
nio f-1(UNV)S<R". Supponiamo che queste funzioni siano infinite volte dif- 
ferenziabili e che la stessa cosa sia vera per le espressioni delle f-coordinate 
mediante le g-coordinate. Allora le carte f e g si dicono compatibili. Sia ora 
(fi) una certa famiglia di carte su X che ricoprano tutto X: Ufi(R")=X. Essa 


Y 
si chiama atlante su X se ogni due carte f;, f; sono compatibili. 

Due atlanti (f;) e (g;) su X si dicono equivalenti se ogni carta f; è com- 
patibile con ogni carta g;. Si può credere che la relazione di equivalenza fra 
gli atlanti si definisce effettivamente cosî. 

La struttura di varietà liscia (o infinitamente differenziabile) su X si de- 
finisce con una certa classe di atlanti equivalenti su esso. Tutti questi atlanti 
si possono riunire in un atlante massimale. 

Se nella definizione della compatibilità delle carte si sostituisce la differen- 


Sile iii 


siii 
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ziabilità infinita con la richiesta di essere differenziabili m volte, si definisce in 
modo analogo una varietà differenziabile m volte. 

Siano X, Y due varietà lisce di dimensione m e n rispettivamente; f : X+ Y 
sia un’applicazione continua. Allora in un intorno di ogni punto xe X, usando 
le coordinate locali in x e in f(x), possiamo considerare f come un’applicazio- 
ne parziale di R® in R”. Perciò la teoria locale delle applicazioni di varietà 
differenziabili coincide con l’analisi classica reale. L'introduzione di una strut- 
tura globale nella forma di atlanti, che risale a H. Weyl che la ideò nel con- 
testo delle superfici riemanniane, permette di usare i potenti mezzi della to- 
pologia nello studio di varietà globalmente non-omeomorfe a R” e delle fun- 
zioni su esse. Per questo attualmente le varietà differenziabili sono l’oggetto 
fondamentale dell’analisi globale e della topologia differenziale. Esse appaiono 
quali spazi delle fasi dei sistemi fisici. In particolare, nella teoria generale della 
relatività i modelli spazio-tempo sono varietà differenziabili. 

Due varietà lisce X, Y si dicono diffeomorfe se esiste un omeomorfismo 
f:X+ Y che, in coordinate locali, sia dato mediante funzioni lisce dotate di fun- 
zioni inverse lisce. Una scoperta notevole degli ultimi decenni consiste nel fatto 
che esistono varietà molto classiche, per esempio le sfere, sulle quali possono 
essere introdotte strutture lisce sostanzialmente diverse tra loro. Per esempio, 
sulla sfera a sette dimensioni di tali strutture ve ne sono 28 [Milnor 1956]. 


3.7. Varietà analitiche. 


Sul modello della definizione delle varietà differenziali si possono introdurre 
le varietà analitiche complesse {e reali). Sia U CC” un certo insieme aperto. 

Una funzione f : U+C si dice analitica nel punto 29, ..., x9)e U se essa 
è sviluppabile in una serie di potenze: 


f(x, DIS) %n) =} Gi in (1), 


dove 4;,...,€ C, ;=0, convergente in un intorno di questo punto. Una funzione 
f sì dice analitica su U se ciò è vero per ogni punto di U. 

Si chiama carta analitica su una varietà topologica X di dimensione 27 ogni 
omeomorfismo f : U>X della sfera aperta UCC” con un sottoinsieme aperto 
di X. Una carta analitica f fornisce su _X le coordinate locali analitiche. Cosi 
come nel caso liscio, due carte si dicono compatibili se il passaggio dalle une alle 
altre coordinate è dato da funzioni analitiche. Dopo di che è chiaro come si 
definiscono gli atlanti analitici, la struttura di varietà analitica complessa su X 
e la nozione di isomorfismo analitico f : X+ Y. 

Questa struttura è più rigida della struttura di varietà differenziabile. Per 
esempio, la parte interna di un cerchio in C è diffeomorfa con tutto il piano 
complesso C, ma non è analiticamente isomorfa a C. Infatti, un’applicazione ana- 
litica di C in un cerchio è una funzione analitica limitata su tutto il piano, 
ma ognuna di tali funzioni è costante. 

Le definizioni date di varietà lisce e analitiche mostrano la tecnica gene- 
rale nell'usare le applicazioni (parziali) per incollare oggetti globali a modelli 
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locali di un dato tipo. Per concludere, è opportuno descrivere ancora una classe 
importante di strutture, dove questa stessa idea interviene in una variante un 
po’ diversa. 


3.8. Fasci. 


Cominciamo con un caso particolare. Sia X una varietà analitica ed U sia 
un insieme aperto. Una funzione f : U+C si dice analitica se essa è analitica 
nelle coordinate locali in un intorno di ogni punto xe U. Indichiamo con 
T(U, Oy) l'insieme delle funzioni analitiche su U. La collezione di tutti i 
T(U, Oy) gode delle seguenti proprietà: 

1)se UCV, in modo naturale è definita l’applicazione-restrizione 

ry.g: T(V, Oy) +T(U, Oy). Se USVSEW, si ha: rp ,u=fv,uw.vi 
2) se U= UU; ed è data una funzione analitica fe T(U, Oy), la famiglia 
delle sue restrizioni f;=r.r,feT(U;, Oy) è definita univocamente da 
f e le restrizioni f;, f; concordano su U;NU;, cioè ty, unu;(fi)= 
A ru; v:nu;(S); 

3) al contrario, se U= UU; e se per ogni U; è data una funzione analitica 
fieT(U;, Ox), essendo per tutti gli i, j ro, unu;(f)=ru,vinv($): 
esiste allora fe T(U, Oy) con la proprietà ry,v;(f)=fi per ogni è. 


L’assiomatizzazione di queste proprietà conduce alla definizione generale 
di fascio di insiemi F su uno spazio topologico X. Dare un fascio & significa 
dare gli ‘insiemi I'(U, 5), uno per ogni insieme aperto USX, e le applica- 
zioni-restrizioni rg : I(V, 3)+I(U, 5) per ogni coppia d’insiemi aperti 
UCV. Questo insieme di dati {T(U, 3), ry,y} deve soddisfare esattamente 
quelle proprietà che si sono formulate sopra per I (U, Oy). Occorre solo sot- 
tolineare che, nella definizione generale di fascio, gli elementi fe T(U, 3) non 
sono necessariamente funzioni su U in qualunque senso della parola e le ap- 
plicazioni-restrizioni ry,y devono essere assegnate a priori. 

La struttura di fascio è uno dei mezzi di globalizzazione più generali at- 
tualmente noti. Essa, insieme con la nozione di topologia, è servita da punto 
di partenza per le successive generalizzazioni di A. Grothendieck. 

Osserviamo ancora che gli insiemi T(U, 3) possono essere dotati di strut- 
ture complementari, per esempio, della struttura di gruppo. Se tutte le ap- 
plicazioni ry,y sono omomorfismi di gruppi, $ si chiama fascio di gruppi. 
Analogamente si possono definire i fasci di gruppi abeliani, i fasci di spazi li- 
neari, ecc. Per esempio, il fascio delle funzioni analitiche su una varietà anali- 
tica è un fascio di anelli, poiché la restrizione delle funzioni è compatibile con 
la loro somma e il loro prodotto. 


4. Singolarità delle applicazioni. 


Nei $$ 1 e 2 si è già accennato al significato naturale-scientifico della no- 
zione di singolarità di un’applicazione. Qui si riporteranno alcune situazioni 
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matematiche caratteristiche, nelle quali questa nozione si presta a precisazioni 
diverse. 

In generale la nozione di singolarità di un'applicazione f : X+ Y presup- 
pone la descrizione preliminare di una certa proprietà locale dell’applicazione 
stessa, che, in ogni punto xe X, f può, o non può godere, ma che f gode 
nella maggioranza dei punti di X (in uno, o in un altro senso della parola). I 
punti, dove questa proprietà non ha luogo, sono punti singolari per f. AI limite 
f può persino non essere definita nei suoi punti singolari; ciò significa, in verità, 
che f ha la forma f : X,-+Y, dove X, è il complemento in X dell'insieme dei 
punti singolari di f, mentre le singolarità si caratterizzano per questo 0 quel 
comportamento di f nei punti di approssimazione xe X al punto singolare 
xe X\X,- Seguono alcuni esempi. 


4.1. Discontinuità e spezzature. 


Sia D un certo intervallo della retta reale R; f: D+ sia una funzione 
reale su D. Essa è continua nel punto xe D se, per x tendente a xy, il limite 
di f(x) esiste ed è uguale a f(xo). Questa definizione è equivalente a quella 
data al $ 3. Nel caso contrario f si dice discontinua nel punto x. Esempi sem- 
plici di discontinuità: f(x)=0 per tutti gli «4x9, f(x) =1; f(x)=0 per xS%o; 
f(a)=1perx>x,. Un esempio più complesso: f(x) =sen 1/x per x7#0,f(0)=a, 
dove a è un numero arbitrario; qui f(x) può non aver del tutto limite per x 
che si approssima a zero, oppure avere quale limite ogni numero compreso tra 
—1 e +1 (estremi compresi) a seconda di come x si approssima a zero. 

Una funzione f(x) può essere continua in tutto il suo dominio di definizione, 
ma differenziabile solo fuori di alcuni punti. La condizione di differenziabilità 
in un punto x, significa la presenza di una tangente definita al grafico di f nel 
punto <xp, f(xo)), oppure, più formalmente, l’esistenza del limite di 


SE) _H%0) 


x—%X0 


per x che tende a xy. La funzione f(x)=]|x| (cioè, uguale a « perx2oe a —x 
per x<o) è differenziabile in ogni punto x#0; la sua derivata d (x) =f"(x) 


(=1 per x>o, —1 per x<0) nel punto x =0 ha una discontinuità, mentre 
la stessa funzione f(x), cioè il suo grafico, in questo punto è «spezzato». 

Può accadere che attorno a un punto xy la stessa funzione e alcune sue 
prime derivate, f‘(x), ..., f*(x), siano continue, mentre f"*1(x) sia discontinua 
in x,. Ciò può avvenire quando si «congiungono» curve diverse; per esempio, 


- prolungando un segmento di retta con un arco di circonferenza tangente alla 


retta nel punto di congiunzione: qui = 1. Nel progettare una strada ferrata, 
per esempio, un tale punto può essere considerato singolare. Il grafico dello 
spazio percorso da un punto materiale ha una tale singolarità nel punto dove 
improvvisamente una forza comincia, o smette di agire. È, questo, il moto 
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di un razzo vicino al momento in cui si stacca il propulsore e il razzo co- 
mincia a muoversi lungo una traiettoria balistica. 


4.2. Singolarità delle funzioni analitiche. 


Sia D un certo insieme aperto del piano complesso C'; per esempio, la parte 
interna di un cerchio. Ricordiamo che una funzione f : D+C si dice analitica 
in un punto xy€ D, se questo punto ha un intorno U tale che, per ogni xeU, 
si ha 


OTT 


(a,eC; la serie converge). Se l’applicazione è analitica in tutti i punti 
xe D\ {xo}, dove xe D, mentre in un intorno opportuno del punto x, ovun- 
que, ad eccezione che per x=%,, essa è rappresentabile mediante una serie 
convergente della forma 

(e.°) 


f(x)= b$ a, (x — xo)", MD>O, Am 70, 


n=e-m 


si dice che f ha un polo nel punto x. Un polo è una singolarità della fun- 
zione f. Il coefficiente a_, si chiama residuo di f nel punto x. Se in con- 
dizioni analoghe f è rappresentata da una serie della forma 


(ce) 
f(a)= b9 An (xx) 
n=—00 
e 4,50 per infiniti n<o, si dice che f ha una singolarità essenziale nel punto xy. 

Si hanno definizioni analoghe per le funzioni analitiche complesse in più 
variabili. 

Nella teoria delle funzioni complesso-analitiche si usa parlare anche di sin- 
golarità tipo ramificazione. La condizione f(x)=Vx, dove per Vx si sceglie 
il valore positivo per i reali x>o, insieme con l’esigenza della continuità, defi- 
nisce in modo univoco una funzione analitica nel dominio infinito D= 
= C\{x|x<o}. L'insieme {x|x<0} è un taglio di C lungo la parte negativa 
dell’asse reale. Quando x si approssima dal di sopra, o dal di sotto a uno stesso 
punto x, di questo taglio, f(x) tende a limiti diversi («rami» di f), ma questi 
limiti sono tanto più vicini l’uno all’altro (e a zero), quanto più x, si avvi- 
cina a zero. Un’esatta definizione delle singolarità tipo ramificazione richiede 
che sia introdotta la nozione di «dominio di ricoprimento universale» per 
D\ {xo}, sul quale f diventa un'effettiva applicazione (univoca). 

Negli ultimi anni lo studio delle singolarità delle funzioni analitiche ha as- 
sunto una notevole importanza nella teoria dei processi di diffusione delle par- 
ticelle elementari. Il modello matematico generale dei processi di diffusione 
parte dalle seguenti idee. In un modo o in un altro si genera un fascio di parti- 
celle con una energia sufficientemente elevata; per esempio, in un acceleratore. 


Ei 
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Si fa interagire con le particelle di un bersaglio (il quale pure può essere un 
fascio) e si registrano le particelle che si formano quale risultato dell’inte- 
razione. Ogni atto dell'interazione viene considerato come una certa applica- 
zione che associa allo stato del sistema prima dell’interazione (fascio, bersa- 
glio) lo stato del sistema dopo l'interazione (prodotti dell’interazione). Sia 
l'uno che l’altro stato sono descritti da vettori in un certo spazio lineare, men- 
tre le probabilità di passare dallo stato iniziale a quello finale sono descritte 
da una speciale funzione complesso-analitica, detta ampiezza di transizione, 
oppure diffusione. L'ampiezza di transizione è una funzione nelle energie e 
negli impulsi degli stati iniziali e terminali delle particelle del sistema. Le sin- 
golarità dell’ampiezza di transizione hanno un importante significato fisico. Per 
esempio, i poli dell’ampiezza di transizione corrispondono alle particelle stabili, 
o instabili presenti nel sistema. I residui in questi poli possono essere inter- 
pretati quali indici dell’intensità delle forze d’interazione connesse con queste 
particelle. L'ampiezza di transizione può avere anche singolarità, tipo punti di 
ramificazione. Le singolarità vicine a questi punti di ramificazione pure si pre- 
stano ad essere interpretate quali forze; più precisamente, si tratta delle co- 
siddette «ampiezze assorbenti». 


4.3. Singolarità delle applicazioni differenziabili. 


Sia D un intorno dello zero, x), nello spazio R*; f : D+ R sia una funzione. 


Essa è m volte differenziabile nel punto x9= (0, ..., 0) se, vicino ad esso, 
m 
S)=LS +9), 
& 


dove le f;(x) sono forme di grado i nelle coordinate locali (x,, ..., x), mentre 
ip(+)| <C max |x;®+!. Il punto x, si dice regolare per l'applicazione f se il 
‘ 


termine lineare f,(x) dell’applicazione è diverso da zero. Ciò significa che f(x), 
vicino allo zero, è ben approssimata da un'applicazione lineare e può essere 
linearizzata mediante un’opportuna trasformazione (non-lineare) del sistema 
di coordinate. In caso contrario f ha una singolarità in questo punto, il cui 
tipo è definito dai termini successivi, f;(i=2), dello sviluppo. Se fs(a)=taft 
+...+x2, f ha la più semplice singolarità «quadratica non degenere ». I modelli 
matematici dei fenomeni dove tali singolarità: risultano importanti sono assai 
complessi; essi sono oggetto della teoria delle catastrofi di R. Thom [1972]. 
Con l’aiuto di tali modelli si tenta di descrivere le biforcazioni dei fenomeni 
a scatti, quando una piccola differenza nelle condizioni iniziali di sviluppo di 
un processo può condurre a un corso bruscamente diverso del processo stesso, 
simile, per esempio, alla diversificazione dei tessuti contigui di un embrione in 
sviluppo, oppure alla polarizzazione di una società omogenea sotto l’influenza 
di fattori politici, ecc. 

Sempre negli ultimi tempi, idee analoghe sono discusse in cosmologia in 
ordine alla violazione di diverse simmetrie delle leggi fisiche. Si presume che, 
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benché le stesse equazioni fondamentali della fisica siano dotate di simmetrie 
di genere diverso, gli scostamenti dalle loro soluzioni osservate, che si realiz- 
zano effettivamente, siano dovuti al fatto che, all’inizio dello sviluppo dell’uni- 
verso, la soluzione simmetrica sia risultata instabile e che, sotto l’influenza di 
fluttuazioni casuali, stia «cadendo» in una delle direzioni di sviluppo stabili, 
ma asimmetriche. 


5. Applicazioni dal punto di vista dell’intuizionismo e del costruttivismo. 


Come abbiamo più volte sottolineato, la nozione di applicazione general- 
mente accettata nella matematica moderna è strettamente legata alla nozione 
di insieme e alle convenzioni fondamentali relative al linguaggio della teoria 
degli insiemi. Questa situazione si è venuta affermando storicamente in modo 
tutt'altro che subitaneo. Dopo Newton e Leibniz, fondatori dei principî del- 
l’analisi matematica moderna, per molto tempo in matematica si sono consi- 
derate solo quelle applicazioni assegnate descrivendo in modo esplicito il modo 
di calcolarne i valori (con precisione arbitraria), o, al limite, quelle descritte 
con una formula esplicita in questo o quel frammento simbolico del gergo ma- 
tematico. Per esempio, una funzione R+ poteva essere data dalle formule 
y=x?, y=sen x, oppure 


(ec) gn 
4 è ni 
L'idea di applicazioni «arbitrarie» si è formata parallelamente a quella di in- 
siemi «arbitrari». Nel corso di questo sviluppo si superò il secolare precon- 
cetto contro l’uso in matematica della nozione d’infinito attuale. Soltanto dopo 
che furono posti i fondamenti del linguaggio degli insiemi divenne possibile 
una precisa definizione della nozione generale di applicazione. 

Da questo punto di vista le applicazioni, descritte da queste o quelle classi 
di formule, o di testi, in questo o quel linguaggio, possono essere considerate 
come uno speciale oggetto di studio. Qualche volta tale studio può confinare con 
la problematica della logica matematica, poiché presuppone un’esatta descri- 
zione preliminare del linguaggio nel quale vengono descritte le funzioni di una 
data classe. Cosi è per la nozione di funzione algoritmicamente calcolabile. In 
altri casi questo linguaggio veniva individuato in modo sufficientemente chiaro 
quale frammento del gergo matematico generale. Cosf si può descrivere espli- 
citamente la classe delle funzioni (localmente) analitiche, definite mediante se- 
rie di potenze convergenti, oppure la classe delle soluzioni delle equazioni dif- 
ferenziali a coefficienti costanti, ecc. 

Esistono scuole di specialisti dei fondamenti della matematica (l’intuizioni- 
smo, il costruttivismo e loro sfumature), le quali ritengono illegittime le no- 
zioni generali d’insieme infinito e di applicazione arbitraria assunte nel me- 
todo assiomatico. A. ciò è legata la critica a molti modi di assegnare una fun- 
zione usati nella matematica teoretico-insiemistica; per esempio, all’assioma 
della scelta. In particolare, in diverse varianti della matematica costruttivistica 


i 
; 
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si considerano solo quegli oggetti che possono essere esplicitamente costruiti, 
in un senso ben definito della parola, mediante mezzi finiti precedentemente 
descritti. Queste «matematiche costruttive», di regola, possono essere, a loro 
volta, interpretate in termini teoretico-insiemistici, dopo di che essere consi- 
derate quali sottoteorie di classi speciali d’insiemi e di applicazioni vicine, nello 
spirito, alla teoria della calcolabilità algoritmica. Tuttavia gli intuizionisti e i 
costruttivisti filosoficamente più coerenti (Brower, Heyting, A. A. Markov) 
non accettano tale interpretazione. 

Le concezioni intuizionistiche della matematica possono essere suddivise, 
grosso modo, in due componenti: una negativa e l’altra positiva. La parte ne- 
gativa è un sistema di argomentazioni a favore della rinunzia alla nozione di 
infinito attuale; contro l’uso dei principî della logica ordinaria applicati a que- 
sto infinito e, come corollario, a favore della rinunzia alla maggior parte delle 
definizioni, delle costruzioni e dei risultati che si hanno in matematica, tutto 
ciò essendo ingiustificato e incomprensibile. La parte positiva è un sistema di 
principî e di risultati proposti in sostituzione della matematica classica rifiutata. 
Questa parte si presta difficilmente ad una esposizione in un linguaggio vicino 
a quello classico, poiché presuppone la rinunzia a quelle stesse abitudini fonda- 
mentali di un matematico con una cultura ordinaria. Cosî, per un intuizionista 
un’argomentazione per una dimostrazione è quella che in ogni suo passaggio è 
«evidente» e non quella che in ogni suo passaggio risale a un sistema di assiomi 
e di regole d’inferenza precedentemente convenuti. L’«evidenza» è una nozio- 
ne soggettiva, il cui significato varia da persona a persona e per tempi diversi 
Cionondimeno, gli intuizionisti assumono quali nozioni matematiche primitive 
quelle che «sono chiare per ogni essere umano normale e persino per i pic- 
coli fanciulli» [Heyting 1956] e le nozioni di «essenza» e «possibilità di ripe- 
tere infinitamente questa essenza» quali sorgenti della nozione di numero na- 
turale. Le proprietà elementari dei numeri naturali si manifestano mediante 
una «semplice considerazione». Non appena questi concetti siano assunti, l’a- 
ritmetica dei numeri interi e razionali nella variante degli intuizionisti risulta 
parallela a quella classica, ad eccezione del linguaggio (che per gli intuizionisti 
non è soggetto a precisazioni troppo rigide) e della semantica che, in generale, 
è difficile confrontare. Forti divergenze con la matematica classica cominciano 
a livello dei numeri reali e delle funzioni su loro. Nella matematica classica un 
numero reale può essere dato, per esempio, quale classe di successioni equi- 
valenti di Cauchy di numeri razionali. Ma già nella nozione di «successione di 
Cauchy» è inclusa quella di applicazione dei numeri interi nei razionali. Gli 
intuizionisti sostituiscono questa nozione, che si appella all'insieme attualmente 
infinito dei numeri interi, con la nozione di «successione che si estende infini- 
tamente». «Con ciò è indifferente in qual modo siano definiti i termini della 
successione; se con una legge, o con una libera scelta, o a sorte, o in qual- 
siasi altro modo» [Heyting 1956]. Pertanto il primo esempio di applicazione 
«arbitraria» fra insiemi infiniti riscontrabile nell’intuizionismo è legato all'idea 
del tempo fisico, che è incompleto e che non si presta ad essere considerato 
quale unico insieme di tutti i suoi momenti. 
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Questa idea si estende gradatamente sempre pit e si allarga il dominio della 
sua applicabilità. Cosî, per un intuizionista, l’affermazione, secondo la quale 
un numero reale p, precedentemente definito, non è razionale, può essere la 
constatazione del fatto che, al momento di questa enunciazione, la razionalità 
di p non è stata ancora dimostrata. Ciò diverge fortemente con il linguaggio 
della matematica classica e costringe all’uso di diverse precauzioni linguistiche 
affinché si possa distinguere la precedente enunciazione da quella con il seguente 
significato: «supponendo la razionalità di p, giungo in un modo o in un altro a 
una contraddizione ). Per il matematico classico qui vi è una mescolanza di due 
diversi livelli di descrizione: un livello di «matematica vera e propria» e un li- 
vello di « descrizione di questa matematica », ma un intuizionista non è d’accordo 
con questo punto di vista. 

Non è qui il caso di entrare in altri particolari. Da quanto si è detto è chiaro 
che le idee sugli oggetti matematici fondamentali, in particolare sulle appli- 
cazioni, che si hanno nella matematica classica e nell’intuizionismo sono so- 
stanzialmente inconfrontabili. Ciò nonostante è possibile ed utile un’analisi suf- 
ficientemente formalizzata, o produrre modelli delle concezioni intuizionistiche 
nell’ambito della matematica classica. Benché ciò, secondo gli intuizionisti, 
non possa riflettere adeguatamente la sostanza delle loro idee, tali modelli ri- 
sultano fruttuosi nella matematica classica e sono legati all’analisi delle strut- 
ture che in essa sorgono in modo indipendente. Cosi, nella costruzione dei 
modelli non-standard della teoria degli insiemi, con l’aiuto dei quali si dimo- 
stra l’insolubilità di una serie di problemi classici, si può scorgere la classica 
realizzazione delle idee intuizionistiche sulla «formazione indeterminata » delle 
successioni e sulla nozione relativa di «verità» che sono simili alla «verifica- 
bilità a un dato momento». A una tale comprensione si presta il metodo del 
forcing secondo Cohen nella teoria assiomatica degli insiemi. 

Le concezioni intuizionistiche, a loro volta, furono sottoposte a critica da 
parte tanto dei seguaci della matematica classica, quanto dei suoi avversari che 
richiedono, però, una precisazione delle nozioni fondamentali dell’intuizionismo. 
A questi ultimi appartengono le diverse scuole di costruttivisti. Per i costrutti- 
visti della scuola di A. A. Markov la nozione fondamentale della matematica è 
quella di «oggetto costruttivo» che, il più delle volte, appare quale nozione di 
«testo in un alfabeto finito». La nozione di applicazione interviene quale no- 
zione di «algoritmo» nel significato precedentemente chiarito. Un algoritmo 
elabora testi in altri testi. Un numero naturale n, per esempio, appare quale 
testo di x segni |...|, disposti in fila e compresi tra segni speciali di «spa- 
ziatura» all’inizio e alla fine. Un’applicazione dell’insieme dei numeri naturali 
in se stesso è un algoritmo che elabora tali testi in testi dello stesso tipo. Un 
algoritmo, a sua volta, può essere considerato quale oggetto costruttivo, cioè 
un testo, scritto magari in un alfabeto più grande. Pertanto sono possibili al- 
goritmi applicabili ad altri algoritmi, cioè dei «funzionali», ecc. Sviluppando 
conseguentemente queste idee si può giungere a varianti costruttive di grandi 
frammenti della matematica. 

Esaminando questo punto di vista bisogna tener presente la seguente cir- 
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costanza. I risultati finiti delle teorie matematiche appaiono spesso effettiva- 
mente quali descrizioni di procedure di calcolo di funzioni di questo, o di 
quel tipo, d’invarianti numerici, ecc. Possono essere esempi gli algoritmi, o i 
programmi dei calcolatori che permettono di risolvere le equazioni della fisica 
matematica, di produrre le tavole delle funzioni speciali, ecc. In questo senso 
i risultati matematici «tangibili» sono affermazioni su oggetti costruttivi verifi- 
cabili costruttivamente. Tuttavia, può accadere che, con metodi puramente co- 
struttivi, non si possano riconoscere proprietà importanti di oggetti costrut- 
tivi; per esempio, la coincidenza di due serie di oggetti costruttivi assegnate con 
costruzioni diverse. Se f e g sono due funzioni calcolabili con argomenti e a 
valori naturali dati, diciamo, con due programmi per un calcolatore, può capitare 
che sia f(n)= g(n) per ogni n e che, tuttavia, ciò non possa essere dimostrato 
senza ricorrere alla nozione d’infinito attuale (vale a dire, ai metodi della teoria 
analitica dei numeri). Ciò è legato al teorema di Godel sulla incompletezza; 
un’opportuna estensione del linguaggio e dei suoi mezzi deduttivi può rivelare 
delle affermazioni, che si formulano nel vecchio linguaggio e sono vere, ma la 
cui veridicità non si presta ad essere stabilita con mezzi deduttivi del vecchio 
linguaggio. 

Tale genere di considerazioni, oltre ad argomenti puramente filosofici, con- 
duce la maggioranza dei matematici a rifiutare le limitazioni costruttivistiche 
quali basi accettabili per i fondamenti della matematica. Naturalmente ciò non 
diminuisce l’importanza dello studio sistematico degli insiemi e delle applica- 
zioni costruttive nell’uno o nell’altro senso della parola. 

Per dare un’idea della natura dei limiti dei mezzi costruttivi si farà l'esempio 
di un problema che è, per principio, irrisolubile con questi mezzi. Ci si baserà 
su alcune nozioni della teoria generale di programmazione per i calcolatori a 
cifre. 

A un centro di calcolo pervengono programmi in un linguaggio algoritmico 
(tipo Algol). Essi vengono introdotti nel calcolatore, dove un programma spe- 
ciale, il codificatore, li traduce in programmi nel linguaggio dei codici di mac- 
china; solo dopo, un tale programma è accettato dal calcolatore e serve per un 
calcolo reale. Alcuni programmi nel linguaggio algoritmico contengono errori, 
diciamo sintattici; il codificatore reagisce ad alcuni errori fermandosi e segna- 
landoli al programmatore. 

Sembra naturale porre il problema di scrivere un codificatore che in tutti i 
casi distingua i programmi regolari da quelli irregolari. 

Precisiamo il problema. Fissiamo un linguaggio algoritmico L; il suo alfa- 
beto è costituito da un numero finito di segni. Ogni successione finita di segni di 
questo alfabeto si chiama testo. Un testo si dice programma regolare se la sua 
traduzione nel linguaggio dei codici di macchina è possibile e se, dopo aver 
introdotto questo programma, la sua traduzione fa funzionare il calcolatore 
per un tempo potenzialmente infinito e conseguentemente produce in uscita 
una tabella della forma (1, f(1)); (2,/(2)); (3./(3)); .... dove gli f(n) sono 
numeri naturali. In altre parole, i programmi regolari calcolano funzioni con 
argomenti naturali e a valori naturali. 
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Chiamiamo cODIFICATORE (Cc) un programma nel linguaggio L tale che, 
per ogni testo in ingresso, dopo aver funzionato, dia in uscita 1, se il testo è un 
programma regolare, e o nel caso contrario. I programmi regolari, cosi come 
tutti i testi, sono oggetti costruttivi, e il c è un mezzo costruttivo per la loro 
elaborazione. 

Dimostriamo che il c non esiste. Supponiamo il contrario e, usando il c, 
scriviamo un certo programma regolare che chiameremo PROGRAMMA PRINCI- 
PALE (PP). In un modo qualsiasi ordiniamo i simboli del linguaggio L; chia- 
miamolo ordinamento alfabetico. Corrispondentemente ordiniamo i testi nel 
linguaggio £ in ordine alfabetico. Dopo di che supponiamo che il PP funzioni 
cosî: 


1) uno speciale sottoprogramma del PP costruisce uno dopo l’altro tutti i 
testi nel linguaggio L in ordine alfabetico; 

2) uno dopo l’altro i testi costruiti vengono assegnati in ingresso al c la cui 
uscita, o o 1, viene elaborata dal PP nel modo seguente. Se è o, il te- 
sto non è un programma regolare e, in tal caso, il PP assegna in in- 
gresso al c il testo successivamente costruito. Se è 1, il testo è un pro- 
gramma regolare per calcolare la funzione f,, dove n è l’indice ordinale 
nella successione dei programmi regolari, e, in tal caso, il c traduce 
questo testo in codici di macchina; il programma cosi ottenuto viene 
fatto funzionare esattamente fino a calcolare il valore f,(#); a questo 
valore viene aggiunto 1 e all’uscita del PP si ha la coppia di numeri 


(n, fu(M) +1). 


È chiaro che il PP è un programma regolare. Perciò la funzione F(m)=f,(M+1 
dev'essere contenuta nella successione (f,, fa; fa; ...) delle funzioni calcolabili 
mediante programmi regolari, le quali tutte sono generate, l’una dopo l’altra, 
dal PP. Ma ciò porta a una contraddizione, poiché F evidentemente è diversa 
da ogni f; quando in entrambe si ha quale argomento #. Pertanto il c non esiste. 

Si noti che abbiamo richiesto che il c dev'essere scritto nello stesso linguag- 
gio L dei programmi regolari; altrimenti il PP non potrebbe far parte dei pro- 
grammi regolari in questo linguaggio e il ragionamento non avrebbe retto. Se 
il linguaggio L è sufficientemente povero, mentre il linguaggio del codificatore 
è sufficientemente ricco, il riconoscimento dei programmi regolari qualche 
volta risulta possibile. Ma ciò significa semplicemente che noi consapevolmente 
restringiamo la classe delle funzioni calcolabili considerate proprio per rag- 
giungere questo scopo; se il linguaggio, nel quale è scritto il codificatore, è già 
dato, diventa naturale scrivere anche i programmi per il calcolo in questo lin- 
guaggio, usandolo in tutta la sua completezza. 

Per concludere, va osservato che le discussioni sulla sostanza e sulla legit- 
timità delle diverse idee matematiche sono essenzialmente filosofiche e non pos- 
sono essere risolte in modo univoco. La questione dell’accettabilità di questa o 
quella considerazione viene risolta da ogni matematico a partire da profonde 
convinzioni psicologiche, sulle quali possono influire l'educazione ricevuta, il 
temperamento e persino il chimismo individuale dei processi biologici. Con 
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certezza si possono constatare solo due circostanze. Prima di tutto, la critica 
intuizionistica e costruttivistica alla matematica classica e moderna finora non 
pare convincente per la maggioranza degli specialisti di matematica, pura o ap- 
plicata che sia. Inoltre, tutte le concezioni positive che vengono proposte in 
sostituzione di quelle classiche restringono fortemente l’arco di nozioni che 
si propone di ritenere legittime, e l’arco di affermazioni che si ritiene abbiano 
significato e siano vere. Ciò va contro i bisogni che s’incontrano nella maggio- 
ranza delle applicazioni; in particolare, nelle scienze fisiche, dove si richiedono 
mezzi sempre più nuovi per riconoscere la verità e si usano formalismi mate- 
matici sempre più nuovi che non stanno nel letto di Procuste di concezioni 
precedentemente preparate. 


6. Categorie e funtori. 


Il ruolo eccezionale delle applicazioni, quale nozione matematica fondamen- 
tale quanto la nozione di insieme e la nozione di struttura da esse derivate, 
è riflesso nella teoria delle categorie, formatasi negli ultimi due decenni. Ini- 
zialmente, le sue nozioni fondamentali si generarono quali assiomatizzazioni 
di una serie di situazioni simili in topologia e nell’algebra, particolarmente 
quella omologica. Con lo sviluppo del suo apparato e delle sue applicazioni 
alla geometria algebrica, all’analisi funzionale, alla logica, alla teoria dei nu- 
meri, ecc., il linguaggio delle categorie ha assunto gradatamente lo status di 
linguaggio fondamentale e persino alternativo rispetto al linguaggio della teoria 
degli insiemi. 

AI livello attuale è meglio immaginare la situazione nel senso che la descri- 
zione categoriale degli oggetti matematici è duale rispetto alla loro descrizione 
strutturale. Dal punto di vista della teoria delle strutture un gruppo, o uno 
spazio topologico è un insieme dotato di una determinata struttura, che è, rispet- 
tivamente, una legge di composizione che soddisfa gli assiomi gruppali, o un 
insieme dei suoi sottoinsiemi aperti che soddisfano gli assiomi della topologia. 
Dal punto di vista della teoria delle categorie un gruppo, o uno spazio topo- 
logico X è un oggetto della categoria di tutti i gruppi (rispettivamente di tutti 
gli spazi topologici), considerato insieme a tutti i suoi omomorfismi in tutti i 
gruppi e a tutti gli omomorfismi di tutti i gruppi in esso medesimo (rispetti- 
vamente, insieme a tutte le applicazioni continue che hanno X quale dominio, 
o codominio). Si può dire che la teoria delle categorie realizza un approccio 
«sociologico » all’oggetto matematico, nel quale quest’ultimo viene considerato 
non come individuo, ma come membro di una comunità di suoi simili. 

In un certo senso, il punto di vista categoriale su una data struttura è tanto 
più efficace quanto più numerosi sono gli oggetti con tale struttura; infatti, la 
teoria di tali oggetti individuali, quale l’anello dei numeri interi, contiene molti 
risultati che forse non sono descrivibili nell’ambito di un approccio categoriale. 
La stessa osservazione vale nella maggior parte dell’analisi classica. 

Si esporranno ora le nozioni fondamentali del linguaggio delle categorie. 
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Una categoria C' è costituita dai dati seguenti: 


a) Un insieme, o una classe ObC, i cui elementi si chiamano oggetti della ca- 
tegoria C. 

b) Per ogni coppia ordinata <X, Y) di oggetti di C è dato un insieme (even- 
tualmente vuoto) Hom(X, Y) (oppure Homo(X, Y)}, î cui elementi si 
chiamano morfismi dall’oggetto X nell'oggetto Y. 

AI posto di ge Hom(X, Y) spesso si scrive @ : Y+ Y, oppure X-%Y. 
Qualche volta i morfismi si chiamano frecce; X è l’origine della freccia 
g:X-Y, mentre Y è la sua fine. Nella categoria ogni freccia ha una ori- 
gine e una fine definite univocamente. L'insieme, o la classe UHom(X, Y) 
(dove l’unione è estesa a tutte le coppie X, Y della categoria C) qualche 
volta si indica con Mor C. 

c) Per ogni terna ordinata <X, Y, Z) di oggetti di C è data una applicazione 


Hom(X, Y)x Hom(Y, Z)+Hom(X, Z). 


Alla coppia di morfismi gp : X+Y,d : X+ Y essa associa il morfismo X-+Z, 
indicato con po, oppure con Vp e detto composizione di ® e V. 


Questi dati devono soddisfare i due assiomi seguenti: 


A) Per ogni oggetto Xe ObC esiste un (unico) morfismo identità idy : X+X, 
per il quale id; op= e poidy=q ogni volta che le composizioni di id x 
con il morfismo sono definite, cioè quando © ha la forma Y+X, oppure, 
rispettivamente, X> Y. 

B) Qualunque siano 0: X+Y, VD: Y>ÒZ e y:Z+U, abbiamo: (y))g = 
=L(d9). 


Il morfismo @ : X+ Y si dice inverso sinistro del morfismo y : Y+X se 
gop=idy; inverso destro se Dop=idy. Un morfismo g : X+ Y si dice iso- 
morfismo se è dotato sia dell’inverso sinistro che dell’inverso destro. 

È da notare che una formalizzazione della teoria delle categorie comune- 
mente accettata, indipendente dalla teoria formale degli insiemi, per ora non 
esiste. La nozione di insieme o di classe figura già nella definizione degli in- 
siemi degli oggetti e dei morfismi delle categorie. Non si può escludere che 
ciò sia solo un dato della tradizione (la nozione di categoria si è formata nel 
periodo in cui hanno dominato e continuano a dominare le concezioni teoretico- 
insiemistiche). ‘Tuttavia l’autore è incline a credere che, essendo la teoria delle 
categorie cosi penetrata dalla matematica teoretico-insiemistica, è improbabile 
ch’essa possa diventare la base per una costruzione radicalmente nuova dei 
fondamenti della matematica. La questione del rapporto fra le concezioni teo- 
retico-categoriali e quelle teoretico-insiemistiche è già stata affrontata in pre- 
cedenza; si pensa ch’esse forniscano dei modi di descrivere gli oggetti mate- 
matici tra loro complementari e che la rinunzia di ognuno di questi modi faccia 
diminuire la completezza dell’informazione ottenuta. 

Si descriveranno ora alcuni esempi di categorie. Essi si dividono natural- 
mente in tre gruppi che risalgono alle consuetudini di tempi diversi. 
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PRIMO GRUPPO DI ESEMPI. In questo gruppo di esempi gli oggetti sono in- 
siemi, dotati di una struttura di questo o quel tipo, mentre i morfismi sono 
applicazioni di questi insiemi che concordano, in un determinato senso della 
parola, con le strutture (cfr. $ 3). 

Categoria degli insiemi. Tutti gli insiemi dell’universo di Zermelo-Fraenkel 
formano gli oggetti di una categoria, i cui morfismi sono le applicazioni qual- 
siasi degli insiemi. Si possono considerare diverse sottocategorie di questa ca- 
tegoria: per esempio, la categoria degli insiemi finiti, oppure degli insiemi non 
più che numerabili. 

In generale, una categoria C’ si dice sottocategoria della categoria C, se 
ObC"ZObC' e se, qualunque siano X, Ye ObC", si ha Homg/(X*, Y)C 
cHomg(X, Y). Questa sottocategoria si dice completa se Homg(X, Y)= 
= Homg(X, Y) per tutti gli X”, Y'eC". 

Categoria degli spazi topologici. Sono oggetti di questa categoria tutti i pos- 
sibili spazi topologici e i morfismi sono tutte le loro applicazioni continue. 

Categoria dei gruppi. Gli oggetti di questa categoria sono tutti i possibili 
gruppi e i morfismi sono gli omomorfismi di gruppi. Ricordiamo che, se G 
(rispett. 7) è un gruppo e la composizione degli elementi x, ye G (rispett. e H) 
s’indica xy, allora l'applicazione f : G-+/H si chiama omomorfismo, se f(xy) = 
=f(x)f(3) per tutti gli x, ye G. 

Categoria dei gruppi abeliani. Gli oggetti di questa categoria sono tutti i 
gruppi G con legge di composizione commutativa (xy =yx per tutti gli x, ye G), 
mentre i morfismi sono gli omomorfismi di gruppi. La categoria dei gruppi 
abeliani è una sottocategoria completa della categoria di tutti gruppi. 

Categoria dei gruppi topologici. Un gruppo topologico è un insieme G dotato 
di due strutture; una di spazio topologico e l’altra di gruppo, dove la com- 
posizione (x, y) + xy e l'applicazione elemento inverso, x+x71, sono continue. 
Un morfismo di gruppi topologici G+ è un'applicazione continua che è un 
omomorfismo di gruppi. Per esempio, i numeri reali positivi Rf e tutti i numeri 
reali R sono gruppi topologici rispetto, rispettivamente, al prodotto e alla som- 
ma, mentre l’applicazione log : R#+R definisce un loro morfismo. 

Categoria degli insiemi ordinati. Ricordiamo che una struttura di ordina- 
mento su un insieme X è data da una relazione binaria x<y fra gli elementi 
di X. Scriviamo x<y, se x<y, ma non è vero che x=y. Per esempio, l’ordi- 
naria relazione di disuguaglianza definisce una struttura di ordinamento negli 
insiemi R e Z. Una applicazione f : X-+Y di due insiemi con strutture di 
ordinamento (di insiemi ordinati) si dice monotona (rispett. strettamente mono- 
tona), se da x, <%x, (x, x,€ X) segue che f(x.) </f(x%) (rispettivamente, se da 
x1<%, segue che f(x,)<f(x:)). Si può considerare la categoria degli insiemi 
ordinati con le applicazioni monotone, o strettamente monotone quali mor- 
fismi; la seconda è una sottocategoria (incompleta) della prima categoria. 

In topologia e nell’algebra omologica gioca un ruolo fondamentale la cate- 
goria degli insiemi {o, ..., n}, dove # varia tra tutti i numeri interi non ne- 
gativi, ordinati nel modo ordinario, con le applicazioni monotone quali mor- 
fismi. 
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Categoria delle varietà differenziabili. Siano X, Y varietà differenziabili. 
Un’applicazione continua f : X-+Y si chiama morfismo in questa categoria 
se, localmente, è data da insiemi di applicazioni differenziabili f : RAR" 
(cfr. $ 3). 

Analogamente si definiscono i morfismi di varietà analitiche. 

Categoria di fasci su uno spazio topologico X. Siano F, G due fasci di in- 
siemi su uno spazio topologico X. Un morfismo dei fasci f : F-+G è dato da un 
insieme di applicazioni fy: I(U, F)> (0, G), una per ogni insieme aperto 
UCX. Queste applicazioni devono concordare con le applicazioni-restrizione, 
che s’indicheranno nello stesso modo, yy, sia per F che per G, nel senso che 
rvrvofr=fy°tv.v per tutti gli Ue V, UCV. La composizione di f : F+G 
eg: G+H si definisce mediante un insieme di composizioni gg ofy : (U, F)> 
>(U, H). 

Se F, G sono fasci di gruppi, sui loro morfismi si possono porre ulteriori 
condizioni affinché tutte le fy siano morfismi di gruppi. Ciò conduce alla ca- 
tegoria dei fasci di gruppi su X. Analogamente si definiscono le categorie dei 
fasci di anelli, di spazi lineari, ecc. 

In tutti questi esempi la composizione dei morfismi si definisce mediante 
l’ordinaria composizione teoretico-insiemistica delle composizioni (cfr. $ 3), 
mentre i morfismi identici sono indotti dalle applicazioni identiche dei rispet- 
tivi insiemi su se stessi. 


SECONDO GRUPPO DI ESEMPI. In questo gruppo di esempi gli oggetti sono, 
come prima, insiemi con una struttura di tipo definito, mentre i morfismi non 
sono più applicazioni di questi insiemi. 

Un esempio tipico è la categoria fondamentale della topologia omotopica. I 
suoi oggetti sono spazi topologici, ma un solo morfismo da X in Y è una classe 
intera di applicazioni continue f : X+ Y, ogni due elementi della quale sono 
legati tra loro da una relazione di omotopia, cioè possono essere «deformati » 
uno nell’altro. Un’esatta definizione di omotopia tra le applicazioni fo,fi : X+ Y 
è la seguente: si tratta di una applicazione continua F : [o, 1] x X+ Y tale che, 
se si indica con F, : X+ Y, per telo, 1], l'applicazione F,(x)=F({{}x%), al- 
lora E&;=f € Fi=f,. La verifica degli assiomi delle categorie, in particolare 
l’associatività della composizione dei morfismi (che viene definita quale classe 
di composizione di rappresentanti arbitrari di questi morfismi) è riportata al- 
l’inizio di ogni corso di topologia omotopica. 

Un altro esempio è la categoria delle relazioni additive. I suoi oggetti sono 
tutti i possibili gruppi abeliani. Si chiama morfismo f : X+ Y ogni sottogrup- 
po del prodotto diretto Xx Y. La composizione dei morfismi g : X+Y e 
Ù : Y+Z è definita dalla relazione 


Up= {(x, a)e Xx Z] esiste yeY tale che Ka, EP, (y, deb}. 


Esistono importanti costruzioni analoghe per altre categorie; per esempio, in 
geometria algebrica si considera la categoria importante delle varietà algebriche 
con relazioni quali morfismi. 
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TERZO GRUPPO DI ESEMPI. Di questo gruppo di esempi fanno parte alcune 
classiche forme di strutture su un insieme individuale, che, qualche volta, è co- 
modo considerare quali categorie, senza cambiare sostanzialmente la defini- 
zione fondamentale. 

a) Sia G un certo gruppo. Leghiamo ad esso una categoria, nella quale si ha 
un unico oggetto e; l'insieme dei morfismi Homf(e, e) coincide con G e la com- 
posizione dei morfismi coincide con il prodotto in G. 

b) Sia I un certo insieme ordinato. Leghiamo ad esso una categoria, i cui 
oggetti sono gli elementi di I, mentre l'insieme dei morfismi Hom(x, y) è costi- 
tuito da un solo elemento, se x<y, ed è vuoto nel caso contrario. La com- 
posizione è definita univocamente da queste condizioni. Questa interpretazione 
è in uso particolarmente quando / è un insieme di indici di un certo sistema 
induttivo, diciamo, di gruppi. 

c) Sia E un certo spazio topologico. Leghiamo ad esso una categoria, i cui 
oggetti sono i sottoinsiemi aperti di E, mentre Hom(x, y) consiste di un solo 
elemento, se x Cy, ed è vuoto nel caso contrario. 

Questa riformulazione banale costitui il punto di partenza per una pro- 
fonda generalizzazione della nozione di spazio topologico; si tratta delle cosid- 
dette «topologie di Grothendieck». 

d) Consideriamo un qualsiasi grafo orientato T = (I, F, d : F>IxI) Qui 
I è l'insieme dei vertici del grafo, F è l’insieme dei suoi archi, mentre l’appli- 
cazione d associa ad ogni arco una coppia ordinata di vertici, cioè l'origine e 
la fine di quest’arco. 

AI grafo l' si legano in modo naturale due diverse categorie, i cui oggetti sono 
gli elementi di /. 

In una di esse Hom(x, y) è costituito da tutti i possibili percorsi nel grafo 
T' da x a y lungo gli archi orientati. 

Nell’altra categoria Hom(x, y) contiene un solo elemento, se esiste un per- 
corso da x a y lungo gli archi, ed è vuoto nel caso contrario. 

Queste categorie si possono chiamare categorie, rispettivamente, di schema di 
diagrammi di tipo T e di schema di diagrammi commutativi di tipo T. Il si- 
gnificato di queste denominazioni lo chiariremo più oltre. 

Esiste una serie di utili costruzioni che permettono, a partire da date ca- 
tegorie, di costruirne di nuove. 

Categoria duale. Sia C una certa categoria. La categoria C° ad essa duale è 
data cost: 05C°=0bC, Homo(X, Y)= Homg(Y, X). In altre parole, C° si 
ottiene da C «invertendo tutte le frecce». 

Questa costruzione risulta utile in due casi estremi. Se la categoria C° è vicina 
alla C (p. es., se è equivalente ad essa, come nel caso della categoria dei gruppi 
abeliani finiti), questo stesso fatto è l’espressione d’una certa «Iegge di dualità». 

Al contrario, per la categoria R degli anelli commutativi la sua categoria 
duale «degli schemi affini» è molto lontana da ®; l'inversione delle frecce fa 
rilevare delle proprietà geometriche inaspettate; permette di definire l’incolla- 
tura di oggetti globali a partire da quelli locali e altre importanti operazioni 
«geometriche», al limite innaturali dal punto di vista di R. 
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Categoria di oggetti sopra una data base. Sia C' una certa categoria, S sia un 
suo oggetto prefissato. Introduciamo la categoria Cy con le seguenti definizioni. 

ObCy=tutti i possibili morfismi X->,S della categoria C. Se p:X>S, 
ù : Y+S sono due di tali morfismi, Homg,(g, Y) è definito quale insieme 
dei morfismi y : X+Y per i quali voy=%@. La composizione dei morfismi 
in Cy è indotta dalle composizioni in C. La correttezza delle definizioni e gli 
assiomi delle categorie si verificano per C4 senza difficoltà. Invertendo le frecce 
in queste definizioni, si giunge alla costruzione duale della categoria CS degli 
oggetti di C «sopra» l'oggetto S. 

Queste costruzioni generalizzano tali nozioni, quali quella di K-algebre 
(cioè di un anello A insieme all’omomorfismo strutturale di anelli K-+ A), op- 
pure quella di «fibrato generalizzato» sopra una base B, cioè di uno spazio 
topologico £ insieme con le applicazioni continue E- B. 

Prodotto di categorie. Siano C,, C; due categorie. Definiamo il prodotto car- 
tesiano C=C, x C, ponendo 05(C, x Ca) = 05C; x 065C,. Qualunque siano gli 
oggetti X=<X,, X), Y=<Y,, Ya) di C, dove X,, Y,€ 05C,; Xx, Yge O6bC,, 
poniamo Homy(X, Y)= Home, (X,, Y;)x Homg,(X,, Ya). La composizione 
dei morfismi in C è definita componente per componente. 

I gruppi nelle categorie. La definizione ordinaria teoretico-insiemistica di un 
gruppo X consiste nel dare una legge di composizione sull’insieme degli ele- 
menti di X che soddisfa determinati assiomi. Mostriamo che questa definizione 
si può formulare in termini puramente categoriali e può essere estesa ad oggetti 
di categorie più generali. 

a) Legge di composizione su X. Si tratta di un ‘applicazione XxX x. In 
ogni categoria «con i prodotti diretti (cartesiani)» essa può essere sostituita as- 
segnando il morfismo corrispondente. Il prodotto diretto degli oggetti X, Y nel- 


la categoria C è definito quale oggetto Z insieme con i morfismi Z Seno 
e tale che per ogni oggetto U si ha un isomorfismo degli insiemi Homg(U, Z)+ 


> Homg(U, si x Homg(U, Y) che associa a ogni morfismo US Za coppia di 


morfismi U2L°5 x e U2°y. Una categoria C' si dice categoria con prodotti 
diretti se per ogni due oggetti esiste in essa il prodotto diretto (due qualsiasi 
prodotti diretti di X e Y sono canonicamente isomorfi). 

b) Inversione. Si tratta di un’applicazione î : X-+X. Nella definizione teo- 
retico-insiemistica si ha i(x)= x! per ogni xe X. In ogni categoria possiamo 
assegnare il morfismo corrispondente. 

c) L'unità di un gruppo. Invece d’indicare un elemento distinto dell’insieme 
X, possiamo assegnare il morfismo degli insiemi {21} -+X, dove {@} è l’in- 
sieme standard con un solo elemento nell'universo di Zermelo-Fraenkel. Per 
definire l’analogo di {Zi} in una categoria qualsiasi osserviamo che l'insieme 
delle applicazioni di un insieme arbitrario X in {I} consiste di un unico ele- 
mento. Assumiamo ciò per caratterizzare un oggetto finito E di ogni categoria 
C: un oggetto E si dice finito, se Hom(X, E) consiste di un solo elemento per 
ogni XeObC. Dopo di che l’unità di un oggetto gruppale X è assegnata quale 
morfismo E->X in C. 


e ene 
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d) Assiomi di un oggetto gruppale. Un oggetto X di una categoria C' insieme 
con i morfismi m : Xx X-X,i:X-X ede: E-X si chiama oggetto grup- 
pale se soddisfa i seguenti tre assiomi: 


(m, idx) 


1) associatività : le composizioni dei morfismi XxX XxX XxX x 
(idy, m) vlt 
e XXXxX Xx X-% X coincidono; 
esa . w 8 
2) inverso sinistro: le composizioni dei morfismi XXxX +XXxXX> 


2". X e X->E-% X coincidono. Qui X-> Xx X è il morfismo diago- 


G,idy) 


ai ILA Dy, 9 
nale, cioè tale che le composizioni di X-+ XxX con Xx XX 
sono uguali a idy, mentre X—+£ è l’unico morfismo esistente; 

(., idy) 


Ex 


sE Se ot . ; è 
3) unità sinistra: la composizione dei morfismi X- XxX 


(e, idy) LOR, . 
XX Xx X-% X coincide con idy. 


Si può definire la nozione di morfismo di due oggetti gruppali nella cate- 
goria C e quindi la nozione di «categoria di oggetti gruppali» della categoria C. 
Se, quale C, si prende l’universo teorico-insiemistico, giungiamo all’ordinaria 
categoria dei gruppi. 

Se, quale C, si prende la categoria degli spazi topologici, giungiamo alla 
categoria dei gruppi topologici. 

Un esempio importante di categoria C', nella quale sono soddisfatte tutte le 
ipotesi occorrenti per definire gli oggetti gruppali, è la categoria R°, duale 
della categoria degli anelli commutativi (con unità), cioè la categoria degli 
schemi affini. In essa il prodotto diretto degli anelli X, Y è il cosiddetto pro- 
dotto tensoriale X® Y, mentre l’oggetto finito è l'anello Z dei numeri interi. 
In tale categoria un oggetto gruppale si chiama «schema affine di gruppi». Se, 
invece della categoria R°, si considera la categoria RY, dove K è un certo 
anello, giungiamo alla nozione di schema affine di K-gruppi. 


Funtori. 


Anche la nozione di funtore è un caso particolare di applicazione, ma usata 
nelle categorie. Siano date due categorie C, D. Si chiama funtore F dalla 
categoria C alla categoria D il seguente insieme di dati: 


una applicazione ObC 5 06D; 
una applicazione Fy,y : Homo(X, Y)-Homp(F(X), F(Y)), per ogni X, 
Ye OC. 


Questi dati devono essere soggetti alla condizione seguente: se X Ly, 


Y- Z sono due morfismi nella categoria C, si ha Fy,a(9Fx,e(f)=Fx.z(ef) 
nella categoria D. 

Qualche volta tali F si dicono funtori covarianti dalla categoria C in D, 
mentre i funtori da C° in D si dicono funtori contravarianti da C in D. I 
funtori contravarianti «invertono le frecce». Spesso i funtori appaiono quali 
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«costruzioni naturali » sugli oggetti di una categoria C che li trasformano in og- 
getti di un’altra categoria. 

Se C' è una categoria arbitraria e Set è la categoria degli insiemi, a partire 
da ogni oggetto X della categoria C si possono costruire le applicazioni 
hx : Y-+Hom(X, Y) e 44 : Y-+Hom(Y, X). L’applicazione 4y si estende in 
modo naturale a un funtore da C in Set, mentre 44, si estende ad un funtore 
da C° a Set. I funtori di tale forma e cost pure i funtori ad essi isomorfi, nel 
significato naturale della parola, si dicono rappresentabili. La nozione di funtore 
rappresentabile divenne una delle prime nozioni fruttuose di carattere catego- 
riale generale dopo che, come risultò, molti funtori importanti, che venivano 
costruiti in modo del tutto diverso, erano rappresentabili. Per esempio, in to- 
pologia ad ogni spazio topologico X di una determinata classe, ad ogni gruppo 
abeliano G e ad ogni numero intero n>o si associa un invariante importante, 
cioè il gruppo delle coomologie H”*(X, G). Questo gruppo inizialmente veniva 
definito mediante alcune costruzioni sopra lo spazio X e sopra G. Risultò che 
il funtore X-+/H"(X, G) è isomorfo a un certo funtore della forma 4$, nella ca- 
tegoria della topologia omotopica, dove Y= K(G, n) è il cosiddetto spazio di 
Eilenberg-MacLane. Questa scoperta condusse a sviluppare una tecnica com- 
pletamente nuova in topologia e alla dimostrazione di importanti risultati che 
erano impossibili con i vecchi mezzi. Come dimostrarono A. Grothendieck e la 
sua scuola nelle ricerche successive, una gran parte delle questioni di geometria 
algebrica, per esempio, la classificazione delle diverse varietà algebriche, pure 
viene ricondotta al problema della rappresentabilità di questo o quel funtore. 

Si può dimostrare che un oggetto X è definito univocamente, a meno di iso- 
morfismi, dal funtore 4y, o 4%. Ciò permette di considerare ogni categoria 
quale sottocategoria dei funtori su essa, se preliminarmente è definita la no- 
zione di morfismo dei funtori, o di trasformazione naturale dei funtori. Questo 
punto di vista conduce ad una estensione naturale di molte classi di oggetti, i cui 
casi particolari precedentemente venivano considerati senza una esatta com- 
prensione del loro significato categoriale generale. 

Infine, molte costruzioni teoretico-strutturali possono essere considerate 
quali funtori, ciò che conduce a una migliore comprensione delle loro proprietà. 
Per esempio, è abbastanza nota la nozione di diagramma di strutture di un dato 
tipo, connesse alle applicazioni: cosî la scrittura X--Y è un diagramma del 
tipo - + -; la scrittura 


X->-Y 
Nl 
Z 
è un diagramma del tipo 


‘+. 


Ml 


Tutti i diagrammi di un dato tipo I° possono essere considerati quale funtore 
da una categoria di schema di diagrammi di tipo I alla categoria dove giac- 


SA eee rta pali 
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ciono X, Y, Z, ... (cfr. sopra). Gli schemi di diagrammi commutativi di tipo 
T' conducono a diagrammi commutativi quando le composizioni di tutti i mor- 
fismi del diagramma lungo ogni percorso da un oggetto ad un altro coincidono. 

Nella matematica moderna l’importanza delle concezioni categoriali nello stu- 
dio delle applicazioni è molto grande e sarà ulteriormente chiarita in altri arti- 
coli. [Ju. 1. M.]. 
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Il concetto di applicazione tra insiemi astratti (cfr. insieme) è il frutto del progres- 
sivo astrarsi e generalizzarsi del concetto di funzione (cfr. funzioni) all’interno del cal- 
colo differenziale (cfr. differenziale, infinitesimale). Con l’aiuto del concetto astratto 
di applicazione è possibile ridiscendere all’interno di strutture matematiche parti- 
colari esaminando, nello specifico, situazioni ove intervengono applicazioni concrete 
(cfr. astratto/concreto). Ciò conduce a varie particolarizzazioni e suddivisioni all’in- 
terno del concetto (cfr. locale/globale, geometria/topologia, continuo/discreto). 
Dal punto di vista della calcolabilità effettiva le applicazioni pongono problemi teo- 


.rici e pratici di grande rilievo (cfr. ricorsività, algoritmo, automa) che costringono 


continuamente a ridiscutere il rapporto tra matematica «speculativa» (cfr. matemati- 
che) e scienza applicata. 
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1. Generalità. 


Scopo di ogni scienza naturale è la conoscenza della verità sulla Natura e 
sull’Uomo. Di solito una scienza inizia con una parte descrittiva, volta a de- 
lineare l’arco dei fenomeni studiati e a inventariare le nozioni fondamentali 
della futura teoria. A questo livello viene introdotto anche il linguaggio della 
teoria e si stabiliscono le regole per confrontare i testi [proposizioni], in questo 
linguaggio, con la realtà da essi descritta, cioè con la semantica del linguaggio. 
Possono essere esempi di scienze descrittive la sistematica in biologia, o le 
grammatiche descrittive delle lingue umane. i 

Il livello successivo consiste nell'individuare le leggi fondamentali alle qua- 
li è soggetta la struttura degli oggetti e dei fenomeni studiati, il loro sviluppo 
nel tempo e il loro comportamento in determinate condizioni. La certezza sul- 
la veridicità delle leggi è fondata su una induzione incompleta che parte da os- 
servazioni, esperimenti e dati indiretti, il volume dei quali non può mai essere 
completo. In sostanza è da questo momento che comincia una conoscenza teo- 
rica che permetta di predire tratti caratteristici di situazioni ancor prima che esse 
siano direttamente osservabili nella realtà e senza queste stesse osservazioni 
dirette. 

A misura del suo sviluppo la teoria incorpora in sé frammenti di carattere 
puramente deduttivo sempre più lunghi. In questi frammenti gli enunciati, 
nuovi e veri, si ottengono dalle verità sperimentali e dalle leggi della teoria 
mediante una serie di manipolazioni logiche, dette inferenze deduttive, dimo- 
strazioni, ecc. La parte deduttiva della teoria si sviluppa sulla base delle in- 
formazioni che già si hanno, senza l’uso di conoscenze supplementari. Quanto 
più lunghi sono i frammenti deduttivi della teoria, tanto più pressante diventa 
la necessità di individuare e inventariare le premesse e la logica dei ragionamenti 
deduttivi che vengono usati. 

Questo schema è applicabile anche alla matematica, ma soltanto con delle 
convenzioni essenziali. 

Rispetto agli altri campi del sapere la matematica si distingue per una ele- 
vata astrazione dei suoi concetti fondamentali e per il ruolo dominante che in 
essa hanno i ragionamenti deduttivi. 

L’astrazione dei concetti fondamentali si esprime nel fatto che il linguaggio 
della matematica e le sue sottoteorie ammettono una enorme varietà di seman- 
tiche, o di interpretazioni del tutto diverse tra loro. Ciò dà la possibilità, per 
esempio, ai fisici di considerare la stessa matematica quale linguaggio delle 
teorie fisiche. Questa astrazione già diventa evidente considerando le nozioni 
matematiche più elementari, quali, per esempio, i semplici numeri naturali 
{uno, due, tre). Tali nozioni erano già note alle popolazioni che si trovavano 
ad uno stadio di sviluppo assai primitivo. Secondo gli ultimi dati della lingui- 
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stica comparata, nella lingua con cui si parlava ancora nel Mesolitico (più di 
diecimila anni fa) e che è l’antenata comune a molte famiglie di lingue moderne 
quali quelle indoeuropee, semito-camitiche, degli Urali, dell’Altaj ed altre, vi 
era la parola *tohà, che significa ‘due’ (il cui aspetto sonoro è giunto fino ai no- 
stri giorni con piccole variazioni nelle diverse lingue). Per rendersi conto della 
vastità della nozione ‘due’ al lettore basterà confrontare le sue interpretazioni 
nei contesti che seguono: « due pesci», «due giorni», « dualismo filosofico » (dal 
latino duo ‘due’), «la sesta cifra dopo la virgola nella scrittura decimale dir è 2). 

La struttura deduttiva delle teorie matematiche fornisce dei modelli di 
costruzioni logiche cosi sviluppati, complessi e lunghi, che essa stessa, la ma- 
tematica, costituisce un modello universalmente riconosciuto per costruzioni 
teoriche in ogni dominio del sapere. In misura notevole ciò è legato al fatto che 
l'apparato evoluto del simbolismo matematico costituisce un esempio di lin- 
guaggio artificiale libero dagli equivoci e dalle limitazioni celati nelle lingue 
correnti. Il linguaggio dei simboli, non avendo un legame diretto con la realtà, 
permette di descrivere una infinita varietà di situazioni e sviluppare delle teorie 
che, a priori, non sono collegate a questo 0 a quel campo di fenomeni. 

Il concetto di assioma appartiene a quel numero di nozioni fondamentali 
che fanno parte della metateoria delle teorie deduttive (cfr. $ 3). La parola 
‘assioma’, dal greco dÉ{wy ‘dignità’, indica una di quelle premesse di una data 
teoria deduttiva, la cui veridicità viene assunta, internamente a questa teoria, 
senza dimostrazione e viene poi usata nel seguito come un tutto unico. È possi- 
bile produrre un’argomentazione a favore della veridicità di un assioma (o, quan- 
to meno, a favore di una sua assunzione provvisoria). Tuttavia, rigorosamen- 
te parlando, essa non appartiene alla teoria. La questione riguardante la natu- 
ra della verità matematica, in generale, è molto complessa e, più oltre, al $ 5, 
sarà discussa più particolareggiatamente. 

La parola ‘postulato’, dal latino postulatum ‘si richiede’, si usa attualmente 
come sinonimo di assioma. 'T'uttavia vi sono sfumature diverse nell’uso delle 
due parole che non sono completamente normalizzate. Negli Elementi di Eu- 
clide, secondo Proclo, i postulati affermano l’esistenza di costruzioni di ogget- 
ti geometrici, mentre gli assiomi descrivono le proprietà di questi oggetti. Al- 
cuni specialisti contemporanei di logica matematica chiamano postulati alcu- 
ni presupposti speciali di una data teoria particolare, a differenza degli assio- 
mi logici e generali. Infine si possono chiamare postulati quei presupposti di 
una data teoria assunti, magari temporaneamente, per ricavare da essi delle 
conseguenze, confrontando le quali con questa o quella realtà, si può giudicare 
dei limiti nell’uso di questi stessi postulati. I fisici parlano, per esempio, dei 
«postulati della teoria del campo». 

A scopo illustrativo vediamo alcuni esempi di assiomi senza limitarci a quelli 
strettamente matematici. AI $ 4 verrà esposto un modello completo del sistema 
di assiomi della teoria degli insiemi, che è alla base della matematica moderna. 


ASSIOMA DELL’UGUAGLIANZA. Due oggetti, ognuno dei quali sia uguale ad un 
terzo, sono uguali tra loro. 


Assioma/postulato 994 


Questo assioma è già presente negli Elementi di Euclide. Nelle costruzioni 
matematiche teoretico-insiemistiche moderne esso interviene quale proprietà 
fondamentale delle relazioni di equivalenza: la transitività di queste relazioni. 


SILLOGISMI DI ARISTOTELE. Ecco con linguaggio moderno uno degli schemi 
dei sillogismi: « Se tutti gli oggetti di una classe A godono di una proprietà P e a 
è un oggetto della classe A, a gode della proprietà P» («Tutti gli uomini sono mor- 
tali, Caio è un uomo, quindi Caio è mortale »). 


Gli assiomi dell’uguaglianza e i sillogismi appartengono agli assiomi logici; 
la loro verità viene postulata indipendentemente dalla natura e dalle proprie- 
tà degli oggetti considerati, cioè indipendentemente dall’interpretazione della 
teoria. In essi viene distintamente seguito l’aspetto linguistico-semantico; essi 
regolano l’uso corretto delle parole «essere uguali », «tutti» e simili. Nelle teorie 
formalizzate l’aspetto linguistico interviene in primo piano; l'assioma diventa 
semplicemente un testo unico completamente definito e ogni riferimento ad 
esso avviene secondo regole sintattiche completamente definite. 

Bisogna osservare che l’uso contenutistico persino di un assioma fondamen- 
tale qual è l'assioma dell’uguaglianza può richiedere che siano individuati aspetti 
non banali della situazione descritta. Per esempio, nella fisica quantistica si 
parla della indistinguibilità in linea di principio di tutte le particelle elementari 
di una data classe, — per esempio, degli elettroni, - ammettendo contempora- 
neamente (nella teoria non relativistica) che, negli intervalli di tempo fra una 
interazione e l’altra, l’elettrone mantenga la sua individualità. 

Gli assiomi seguenti appartengono a parti diverse della matematica propria- 
mente detta. 


QUINTO POSTULATO DI EUCLIDE (ASSIOMA DELLE PARALLELE). Se due rette 
intersecate da una terza retta formano una coppia di angoli coniugati interni la 
cui somma è minore di 180°, queste due rette si intersecano in un punto che giace, 
rispetto alla terza retta, dalla stessa parte dei due angoli coniugati. 


Questo assioma ha avuto un ruolo notevole nella formazione della matema- 
tica moderna e dei suoi fondamenti. Per molti secoli la sua verità è apparsa 
meno evidente che non quella degli altri assiomi di Euclide. Per questo sono 
stati intrapresi molti tentativi per dedurlo dai restanti assiomi di Euclide. Nei 
lavori di Lobatevskij, Bolyai e Gauss fu costruita una teoria di geometrie non 
euclidee, quale insieme di deduzioni ricavate dalla negazione del quinto po- 
stulato e dai rimanenti assiomi di Euclide. Questa teoria si spinse assai avanti 
senza incontrare contraddizioni, tanto che sorse la convinzione psicologica della 
non-deducibilità del quinto postulato dai restanti assiomi e quindi della pos- 
sibile sua falsità nel mondo fisico (nella interpretazione, per esempio, delle 
rette euclidee quali raggi luminosi, o delle traiettorie del moto delle particelle 
libere). Tuttavia, il fatto che fino a un dato momento non si sia scoperti 
nella teoria una contraddizione non significa ancora che non si scoprirà mai. 
Evidentemente Gauss era chiaramente consapevole di questa circostanza, ciù 
che probabilmente l’ha indotto a rinunziare, in vità, alla pubblicazione delle 
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sue ricerche sulla geometria non-euclidea. La dimostrazione del fatto che il 
quinto postulato di Euclide non sia effettivamente deducibile dai rimanenti 
assiomi si è accompagnata all'introduzione di un nuovo principio, destinato a 
diventare un metodo importante nella logica matematica del xx secolo. Si tratta 
del principio della interpretazione interna non-standard di una teoria mate- 
matica, o metodo dei modelli. Nell'uso di questo metodo si propone una nuova 
concezione (internamente alla matematica) di tutti i termini della teoria mate- 
matica, per la quale tutti gli assiomi, ad eccezione di quello la cui non-deduci- 
bilità si vuole verificare, risultino veri, e quest’ultimo, invece, risulti falso. Per 
esempio, esiste un modello di geometria non-euclidea, nel quale al piano eucli- 
deo corrisponde un semipiano, ai punti euclidei corrispondono i punti del 
semipiano, mentre alle rette euclidee corrispondono semicirconferenze ap- 
poggiate sulla frontiera del semipiano. Tutte le altre nozioni primitive vengono 
reinterpretate in modo corrispondente. In questo modello il quinto postulato è 
falso. 


ASSIOMA DELL’INDUZIONE DI PEANO. Sia P una certa proprietà dei numeri 
naturali. Supponiamo che 1 goda della proprietà P e che, per ogni n, dal fatto che 
n goda della proprietà P segua che n+1 goda della stessa proprietà P. Allora 
tutti i numeri naturali godono della proprietà P. 


L’assioma dell’induzione è il primo principio matematico fondamentale in 
cui si fa riferimento all’infinito. Infatti esso si appella alla possibilità astratta di 
produrre una serie infinita di verifiche, quanto si voglia lunghe, per convincerci 
sulla validità di P per ogni 7, muovendo a passo a passo da 1 a 2, da 2a 3, da 324, 
.., dan—1a n. È pressoché l’unico «principio dell’infinito » che si incontra nelle 
ricerche metamatematiche, dove di regola, nei sistemi formali, le affermazioni 
contenute nei testi sono stabilite per induzione secondo la lunghezza dei testi 
medesimi. Internamente alla stessa matematica «la teoria elementare dei nu- 
meri » incorpora dei corollari di questo assioma e un numero limitato di principî 
«finiti». Infine Georg Cantor [1895-97] nella sua teoria degli insiemi ha sugge- 
rito una notevole generalizzazione di questo assioma, «il principio dell’induzio- 
ne transfinita», che, in forme diverse equivalenti, è diventato uno degli stru- 
menti più potenti, ma anche più contestati, della matematica del xx secolo. 


ASSIOMA DELL’ASSOCIATIVITÀ. Sia M un certo insieme e supponiamo che per 
ogni due elementi, x, y, di M sia definito un terzo elemento, xy, di M, detto il loro 
prodotto. Se per tutti gli x, y, 2 di M è soddisfatta l’uguaglianza (xy)z = x(yz), si 
dice che per il prodotto in M vale l'assioma dell’associatività. 


Più generalmente le proprietà di una struttura (teorico-insiemistica), po- 
stulate nella definizione della stessa struttura, si dicono spesso assiomi di questa 
struttura. 

A conclusione riportiamo due assiomi delle teorie fisiche. 


ASSIOMA DELL’ADDITIVITÀ DELLE MASSE. La massa dell’unione di due corpi 
distinti è uguale alla somma delle masse di questi corpi. 
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ASSIOMA DELLO STATO NELLA TEORIA QUANTISTICA RELATIVISTICA. Lo stato 
di un sistema è descritto mediante i raggi unitari in uno spazio di Hilbert sepa- 
rabile. La legge relativistica di trasformazione dello stato è data mediante una 
rappresentazione unitaria continua del gruppo non omogeneo SL(2, C) [Streater 


e Wightman 1964]. 


L’ultimo esempio rende particolarmente chiara la necessità di descrivere 
preliminarmente il linguaggio della teoria, la sua semantica, € la necessità di 
una vasta quantità di argomentazioni a favore della verità di un assioma. L'as- 
sioma dello stato, che interviene quale presupposto di una nuova teoria, rien- 
tra nel novero delle più ardite generalizzazioni della fisica quantistica classica. 


2. Formazione del metodo assiomatico in matematica. 


Il metodo assiomatico è quel modo di costruire o di esporre una teoria, per 
il quale le premesse iniziali vengono formulate esplicitamente quali assiomi, 
mentre tutti i risultati successivi sono ottenuti da questi assiomi a conclusione 
di successioni di ragionamenti soggetti alle norme della logica. 

Il metodo assiomatico è per eccellenza un metodo della matematica. Come 
si è già notato, le generalizzazioni scientifiche naturali, tipo teoria dell'evoluzione 
in biologia, o linguistica comparata, si distinguono per una vastità di dati ini- 
ziali osservati e per risultati ottenuti con procedimenti deduttivi relativamente 
brevi. Di più, la maggior parte di questi risultati si presta ad una loro verifica, 
ricorrendo, ove occorra anche più volte, ai dati osservati, di modo che l’esi- 
genza di un loro fondamento logico può essere notevolmente attenuata. 

Al contrario, la matematica e frammenti significativi della fisica si distin- 
guono appunto per il fatto che i risultati essenziali sono ottenuti mediante lunghi 
ragionamenti deduttivi da un numero limitato di premesse. La verifica speri- 
mentale di molti risultati intermedi e di quelli finali risulta persino impossibile 
per questioni sia tecniche che di principio. Del resto, nella maggioranza dei 
casi, per le stesse caratteristiche della matematica, non ha neppure senso porre 
la questione di una tale verifica: l'affermazione, secondo la quale tutti i numeri 
interi godono di una proprietà P, a rigore, dovrebbe essere il risultato di una 
successione infinita di verifiche. Solo singoli punti della teoria ammettono un 
confronto parziale con la realtà in senso pragmatico. tea 

La lunghezza delle inferenze deduttive impone particolari esigenze sulla 
loro normalizzazione. Per diminuire le probabilità di errore le inferenze sono 
suddivise in brevi passaggi e, sin dall’inizio, ove sia possibile, si elencano chia- 
ramente i tipi di questi passaggi. L’uso della lingua naturale si caratterizza per 
il suo impoverimento (per diminuire le omonimie) e per una elevata riserva 
terminologica. o. Mur 

I primi modelli di teorie assiomatiche, giunti a noi nei loro testi, risalgono 
al v secolo a. C. È tradizione ascriverli alla scuola pitagorica. Euclide, Archi- 
mede e Apollonio ci hanno lasciato modelli di esposizioni matematiche dalle 
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quali risulta che il concetto di dimostrazione matematica che essi avevano coin- 
cide sostanzialmente con quello che si ha attualmente. 

Lo sviluppo ulteriore del metodo assiomatico non è stato lineare. Da un 
lato gli studiosi si rendevano conto dei principî logici dei ragionamenti regolari 
e una parte integrante dei loro studi consisteva nell’individuare tali principî. 
Questa linea parte da Aristotele e conduce alla logica formale della scuola di 
Hilbert del xx secolo. Dall'altra parte, particolarmente a partire dal secolo xVII, 
sì è avuto un aumento notevole del materiale matematico, costituito da nuove 
idee e fatti diversi. In certi periodi l’attenzione alla chiarezza dei principî fon- 
damentali si indeboliva e ciò per effetto delle enormi possibilità che si aprivano. 
Nei periodi «critici» successivi si aveva un riesame di tutto il materiale accu- 
mulato e, dall’accurata analisi logica cui veniva sottoposto, si individuavano 
nuove nozioni fondamentali e si chiarivano i legami logici. 

Indichiamo brevemente le tappe di questo sviluppo. 

I fondamenti della logica furono posti da Aristotele. Lo scopo fondamentale 
della sua ricerca gli era perfettamente chiaro: formare un breve elenco di re- 
gole tali che a un loro impiego sistematico e conseguente sia riconducibile ogni 
ragionamento regolare indipendentemente dal contenuto di quest’ultimo e dalla 
veridicità delle sue premesse iniziali. Aristotele non raggiunse completamente 
il suo scopo. Prima di tutto egli non individuò i cosiddetti quantificatori, uni- 
versale ed esistenziale, quali componenti autonome del linguaggio logico, ben- 
ché egli pure distinguesse le proposizioni «universali » e «particolari ». Inoltre, se 
i sillogismi di Aristotele si interpretano come «tautologie » della logica formale 
contemporanea, risulta che le componenti atomiche di queste tautologie sono 
di tipo assai particolare; fondamentalmente «ogni A è B)», oppure «qualche A 
è B». 

Le tautologie con un numero arbitrario di componenti atomiche furono 
profondamente studiate nelle scuole degli stoici e dei megarici. Ad essi era già 
noto sostanzialmente il teorema fondamentale della logica contemporanea dei 
predicati secondo il quale, fra tutte le affermazioni universalmente vere, Vi è 
una «base finita» di tali affermazioni, con la quale si possono ottenere tutte le 
altre mediante successive sostituzioni delle componenti atomiche con enunciati 
arbitrari. Però questi lavori furono dimenticati fino alla loro riscoperta nel XIX 
secolo. 

In Aristotele e poi ancora per molto tempo lo studio della logica dei ragio- 
namenti deduttivi avvenne, quasi del tutto indipendentemente dalla matema- 
tica, su materiale della retorica, della teologia e della giurisprudenza. 

Nel secolo xvII, con lo sviluppo del simbolismo algebrico nei lavori di 
Viète e di Cartesio, si iniziarono dei tentativi volti ad indagare la struttura al- 
gebrica della stessa logica. Idee particolarmente profonde appartengono a 
Leibniz. Ripetutamente egli si accinse ad un progetto di un linguaggio simbo- 
lico universale, nel quale i ragionamenti fossero equivalenti a « calcoli », cioè ad 
operazioni formali sopra i testi, tali da poter essere eseguite in una «macchina 
logica». Allo stesso Leibniz risale il metodo, divenuto poi famoso dopo le sco- 
perte di Gédel [1931], di ricondurre a calcolo «le operazioni sui testi». Questo 
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metodo consiste nel numerare con i numeri primi i «testi atomici» e quindi le 
successioni di questi ultimi numerarle con i prodotti dei numeri primi corri- 
spondenti; dopo di che le operazioni sintattiche si trasformano in operazioni 
aritmetiche. 

La riduzione completa della teoria matematica della dimostrazione alla 
teoria del calcolo fu ottenuta soltanto nel xx secolo nei lavori di Gòdel, Post, 
Turing, Church, dopo gli studi fondamentali di Boole, Peano, Frege, Russell e 
Whitehead, e Hilbert. 

Parallelamente, e per lungo tempo indipendentemente da questa compren- 
sione della struttura delle teorie assiomatiche, si ebbe un processo di organizzazione 
assiomatica di tutto il crescente volume di conoscenze matematiche. Gli storici della 
matematica osservano una attenuazione dello spirito critico e della pedanteria 
degli autori antichi al tempo delle grandi scoperte dell’analisi e della geometria 
analitica. Le nuove idee e gli algoritmi per il calcolo numerico, i loro impieghi 
nella fisica (teoria della gravitazione di Newton, le serie di Fourier, le equazioni 
delle onde e della propagazione termica, i metodi variazionali) erano cosf ricchi, 
mentre le regole per operare sui nuovi formalismi, ricercate a tentoni sulla 
base dell’analogia e dell’intuizione, erano cosi fruttuose che uno studio scrupo- 
loso sul significato e i limiti di applicabilità delle nozioni introdotte appariva 
in un primo momento non corrispondente allo spirito dei tempi. Si operava 
con gli infinitesimi e con i numeri immaginari, non solo senza saper spie- 
gare che cosa significassero, ma spesso senza neppure immaginare quale ca- 
rattere potesse avere una tale spiegazione. Si cercò di uscirne in due dire- 
zioni: per un verso, sviluppando un conseguente formalismo algebrico non 
contraddittorio come se, internamente ad esso, il calcolo fosse esente dalla ne- 
cessità di chiarirne il significato, e per l’altro, riconducendo le nuove nozioni a 
quelle già note, intuitivamente assimilate e, pertanto, apparentemente senza 
pericolo. Entrambe le direzioni risultarono molto fruttuose. La prima condusse, 
nel xx secolo, al programma di Hilbert, volto a formare delle concezioni generali 
dei formalismi matematici, quali giochi con i testi simbolici non richiedenti, in 
linea di principio, alcuna interpretazione. La seconda, dopo che erano state in- 
dividuate le nozioni fondamentali dell’analisi (Cauchy, Bolzano, Weierstrass, 
Dedekind), condusse alla loro riduzione alle proprietà dei numeri reali e poi di 
quelli interi (Dedekind, Peano, Cantor). Infine Cantor, analizzando la struttura 
comune di queste nozioni, ha proposto e sviluppato la teoria astratta degli insie- 
mi, che è divenuta il fondamento della matematica moderna e che è stata assio- 
matizzata nel xx secolo da Zermelo, Fraenkel, Neumann, Gòdel, Bernays ed altri. 

Parallelamente si attuò un’accurata analisi delle assiomatiche geometriche 
che ebbe poi un ruolo particolare nella formazione del metodo assiomatico. A 
questa analisi si accompagnarono, da una parte, la scoperta di una serie di prin- 
cipî della geometria euclidea usati implicitamente negli Elementi e, dall'altra, 
una serie di tentativi per mettere ordine, non solo fra la loro interdipendenza, 
ma anche nei loro rapporti con il mondo fisico (l'assioma delle parallele venne 
riguardato quale ipotesi fisica; la questione della sua assunzione, o negazione, 
doveva essere risolta mediante misurazioni astronomiche, o geodetiche). Ab- 
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biamo già accennato alla storia della dimostrazione della non-deducibilità del- 
l’assioma delle parallele. 

Dopo i risultati più conclusivi di Pasch e di Peano usci il libro di David 
Hilbert Grundlagen der Geometrie [1899], definito da Bourbaki la «carta del- 
l’assiomatica moderna». Hilbert suddivise gli assiomi in alcuni gruppi; esami- 
nò accuratamente quali di essi sono necessari in queste o quelle dimostrazioni 
e quali sono superflui e costruf uno spettro intero di geometrie differenti, otte- 
nute sostituendo, o tralasciando, assiomi diversi. Inoltre Hilbert stabili la non- 
contraddittorietà e la reciproca indipendenza degli assiomi mediante il metodo 
dei modelli interni, costruendo geometrie multiformi di numeri reali. 

Il tentativo più conseguente e fondamentale di una esposizione assiomatica 
di tutte le principali concezioni matematiche moderne è stato intrapreso nel xx 
secolo da un gruppo di matematici francesi, che operano sotto lo pseudonimo 
collettivo di N. Bourbaki (la sua composizione nel corso di oltre trent'anni è 
cambiata; attualmente ad esso appartengono anche scienziati di altri paesi). Que- 
sta esposizione è l’oggetto di un trattato in più volumi, E/éments de mathémati- 
que [1939 sgg.] sottoposto a una regolare rielaborazione e la cui edizione non è 
ancora completa. L'esposizione è articolata attorno alla nozione centrale di 
struttura matematica, di cui sono esempi le strutture di legge di composizione, 
di ordinamento, di topologia, ecc. N. Bourbaki sottolinea il ruolo enormemente 
euristico di una ben organizzata esposizione assiomatica. Per esempio, quegli 
oggetti tradizionali della matematica classica che sono i numeri reali, sono un 
insieme munito delle strutture d’ordine, di corpo, di spazio topologico, di va- 
rietà differenziale e di altre. Non appena queste strutture siano state profon- 
damente studiate, ciascuna separatamente, la loro interazione su un oggetto 
concreto diventa molto più comprensibile. Soprattutto l’esperienza dello studio 
e del discernimento delle strutture mette nelle mani di chi opera in matematica 
un apparato pronto e ricco di nozioni e di metodi per lo studio delle sue questioni 
specifiche non appena che sia stata ravvisata la presenza di queste strutture nel 
dominio considerato. 


3.  Metateoria delle teorie assiomatiche. 


La metateoria delle teorie assiomatiche sta alle stesse teorie come la lingui- 
stica sta alle lingue naturali. La sua formazione nel xx secolo è stata sollecitata 
sia dalle difficili questioni filosofiche sulla natura della verità in matematica 
(esse divennero particolarmente acute dopo che furono scoperti i «paradossi» 
della teoria degli insiemi; cfr. $ 5), sia dal desiderio naturale dei matematici di 
rendersi conto del significato e del carattere della loro attività professionale. 

In questo paragrafo ci limiteremo a discutere a un livello qualitativo alcune 
nozioni matematiche fondamentali. La stessa metateoria può essere in misura 
notevole formalizzata e assiomatizzata; in questa forma essa appartiene già alla 
logica matematica. 

La metateoria considera ogni teoria assiomatica quale collezione (potenzial- 
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mente infinita) di testi in un certo linguaggio. Questi testi sono organizzati 
secondo regole piti o meno esplicitamente formulate che costituiscono la sintassi 
del linguaggio. La descrizione del linguaggio può essere accompagnata da una 
sua interpretazione standard, o da uno spettro di tali interpretazioni, ma ciò 
non è obbligatorio. Rispetto ad una data interpretazione alcuni testi, nel dato 
linguaggio, possono avere la proprietà di essere veri, o falsi. Le regole d’infe- 
renza di una data teoria sono metodi per generare nuovi testi a partire da altri 
già dati, o da testi precedentemente generati. Si intende che, in presenza di una 
interpretazione, le regole d’inferenza applicate a testi veri devono generare di 
nuovo solo testi veri. 

Gli assiomi di una teoria costituiscono un sistema di testi iniziali e questo 
sistema viene assegnato elencando i testi medesimi, oppure mediante regole 
per generarli. I testi che si possono ricavare dagli assiomi dati mediante le 
regole d’inferenza si dicono deducibili. 

Nella maggioranza delle teorie vi è il concetto di negazione di un dato testo 
(enunciato). 

Un sistema di testi (in particolare di assiomi) di una teoria si dice non-con- 
traddittorio se da essi non è possibile dedurre un testo e contemporaneamente 
la sua negazione (cioè una contraddizione). 

Un sistema di assiomi si dice completo, rispetto a una data interpretazione e 
alla nozione di verità, se da questi assiomi si possono dedurre, tutti e soli, i testi 
veri. 
Un sistema di assiomi si dice categorico se esiste solo una interpretazione 
(in una certa classe), rispetto alla quale tutti gli assiomi risultino veri. Per esem- 
pio, il sistema di assiomi di Peano per i numeri interi, in un certo senso (in seno 
alla teoria degli insiemi), può essere ritenuto categorico, poiché definisce soltanto 
un oggetto: i numeri interi. Al contrario, il sistema di assiomi della teoria dei 
gruppi descrive una classe intera di gruppi non isomorfi tra loro. 

Un dato testo di un linguaggio si dice indipendente da un sistema di altri 
testi (per esempio, dal sistema di assiomi) se da questi ultimi non è deducibile 
né il testo stesso, né la sua negazione. Il quinto postulato di Euclide è indipen- 
dente dagli altri assiomi di Euclide. 

I problemi fondamentali della metateoria delle teorie assiomatiche sono i 
seguenti: descrivere il sistema di testi deducibili dagli assiomi; chiarire le que- 
stioni relative all'indipendenza, alla completezza, alla non-contraddittorietà, 
alla categoricità di questo, o di quel sistema di assiomi; stabilire la non-dedu- 
cibilità o l'indipendenza di questo o di quel testo dagli assiomi; descrivere 
l’insieme delle interpretazioni, nelle quali i dati assiomi sono veri. 

Le nozioni metateoriche sopra riportate sono dotate di una minore defini- 
bilità terminologica che non le ordinarie nozioni matematiche. In primo luogo 
ciò è dovuto al fatto che un’idea del linguaggio della teoria si basa sull’esperienza 
delle lingue naturali, le quali sono oggetti non formali e molto complessi. L’uso 
del linguaggio naturale da parte dell’uomo è assai lontano da una manipola- 
zione meccanica dei testi; la generazione della parola, la sua comprensione, il 
rapporto tra la parola e la realtà, o l'arco delle idee descritte si possono studiare 
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effettivamente solo ricorrendo ai dati della psicologia, della neurofisiologia, o di 
altri dominî del sapere, lontani dalla matematica propriamente detta. Ugual- 
mente la logica «naturale» dei ragionamenti deduttivi è, dal punto di vista 
matematico, una nozione vaga, quantunque i matematici siano relativamente 
concordi nello stimare logicamente impeccabile, oppure contenente vuoti logici 
o errori ogni ragionamento dato. Perciò furono intrapresi numerosi tentativi di 
precisare le definizioni date al punto che la metateoria delle teorie matematiche 
ha assunto un livello di precisione paragonabile a quello della matematica con- 
temporanea. I risultati di quest'opera sono il contenuto della logica matematica 
moderna. La metateoria logico-formale studia essenzialmente solo i modelli ma- 
tematici delle teorie assiomatiche ed è per questo che si ottiene una maggiore 
precisione nelle sue affermazioni. 

Riporteremo più oltre, nel linguaggio naturale, il sistema di assiomi della 
teoria degli insiemi secondo Zermelo [1908] e Fraenkel [1928]. Sulla base del- 
la teoria degli insiemi, o di suoi frammenti, è costruita quasi tutta la matematica 
moderna. Per questa ragione gli assiomi della teoria degli insiemi sono «assiomi 
per eccellenza». Tutti gli altri assiomi matematici, dal punto di vista della teoria 
degli insiemi, sono soltanto definizioni di oggetti e delle loro proprietà, studiate 
in questa o in quella particolare teoria come, per esempio, l’assioma dell’asso- 
ciatività del $ 1. 

Parallelamente alla formulazione degli assiomi introdurremo le stesse no- 
zioni matematiche e le notazioni di uso corrente. 


4.  Asstomi della teoria degli insiemi secondo Zermelo-Fraenkel. 


La teoria degli insiemi che descriveremo ha lo scopo di studiare un’unica 
classe di oggetti fondamentali, detti insiemi, ed un’unica relazione binaria fra 
gli insiemi: «essere elemento». La scrittura x e y si legge «l’insieme x è un ele- 
mento dell’insieme y». Inoltre dagli assiomi di Zermelo-Fraenkel segue che 
non esiste una catena x,3x,3x39... di lunghezza infinita. Ne segue che l’ul- 
timo elemento di una catena di questa forma, che non sia prolungabile, è un 
insieme che non ha elementi. Esso si dice vuoto e si indica con @. Un insieme 
finito, tutti gli elementi del quale siano x, ..., %,, può essere indicato con 
{x,, ..., x,}. Pertanto tra gli insiemi dell’universo di Zermelo-Fraenkel sono con- 
tenuti, per esempio, D, {D}, {{S}, ©}, ..., ecc. Una descrizione più esatta del 
processo di «collezionamento» di ogni insieme di questo universo a partire 
dall’insieme vuoto e da insiemi precedentemente costruiti è contenuta negli 
assiomi che ci accingiamo ad esporre. 


ZFI. ASSIOMA DELL'ESTENSIONE. Due insiemi, x, y, sono uguali se, e solo se, 
ogni elemento dell'insieme x è un elemento dell’insieme y e ogni elemento dell’insieme 
y è un elemento dell’insieme x. 


Da un punto di vista formale questo assioma regola l’uso del predicato «es- 
sere uguali» riferito agli insiemi. Rispetto al contenuto questo assioma esprime 
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l’idea fondamentale di Cantor: immaginare un aggregato di oggetti come un 
tutto unico, definito soltanto dai suoi elementi e nient'altro di più. n 

Se gli insiemi x, y sono uguali, scriviamo x = y. Se ogni elemento dell’insie- 
me x è un elemento dell’insieme y, scriviamo x S y e leggiamo «x è un sotto- 
insieme di y». 


ZF2. ASSIOMA DELL'INSIEME vuoto. Esiste un insieme che non contiene ele- 
menti. 


Dall’assioma dell’estensione segue che l'insieme vuoto è unico, cioè che 
due qualsiasi insiemi vuoti sono uguali. 

Nella verifica di questa affermazione il lettore può porre mente ad una lo- 
gica indeterminatezza del linguaggio naturale: è lecito affermare che ogni ele- 
mento dell’insieme x è un elemento dell’insieme y, quando x non contiene 
neppure un elemento? Individuando e normalizzando i principî logici utiliz- 
zabili, la risposta a questa domanda risulta affermativa. © 

Questo assioma e tutti i successivi postulano l’esistenza di insiemi con queste 
o quelle proprietà. 

ZF3. ASSIOMA DELLA COPPIA. Per ogni due insiemi, x, y, esiste un terzo in- 
sieme, 2, elementi del quale sono soltanto x e y. 


Questo insieme, d’accordo con le nostre convenzioni, si può indicare con 
{x,y}; esso è definito univocamente in virtù dell'assioma dell’estensione e si 
chiama coppia non ordinata degli insiemi x e y. Evidentemente fx, gt = {x}. 

Si chiama coppia ordinata degli insiemi x, y, con primo elemento x e se- 
condo y, l'insieme {{x}, {x, y}}. Brevemente si indica con <x, y}. Non è difti- 
cile verificare che (x, y) = Ku, v) se, e solo se, x = e y = v. Le coppie ordinate 
sono usate essenzialmente per definire le nozioni di corrispondenza fra insiemi 
e di applicazione di insiemi (cfr. oltre). 


ZF4. ASSIOMA DELLA SOMMA. Per ogni insieme x esiste un insieme y tale che 
l'insieme 2 è un elemento di y se, e solo se, esso è un elemento di un certo elemento 


dell’insieme x. 


L’insieme y si dice insieme-somma, o unione di x e si indica con La. Al 
posto di Ufx,, x,} spesso si scrive x;Ux,; al posto di U{x,,..., x, } si scrive 
o - 
Ux;, ecc. 
= . . . . 

ZF. ASSIOMA DEL GRADO. Per ogni insieme x esiste un insieme y tale che gli 
elementi di y sono, tutti e soli, î sottoinsiemi di x. 


Notazione abbreviata: y = P(x). La 

Ricordiamo che 2 è un sottoinsieme di x, 2 C x, se ogni elemento di zè un 
elemento di x. Fra i sottoinsiemi di x vi sono sempre % e x; gli altri sottoinsiemi 
di x si dicono propri. E di 20: 

Gli assiomi fin qui formulati sono soddisfatti nell’universo costituito da 
tutti gli insiemi finiti che si ottengono a partire da Z mediante il processo 
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di «collezionamento» successivo degli insiemi precedentemente già costruiti: 
DD} {DAD}, {DA S}{2{2}}}, e così via. Per uscire dai limiti di questo 


universo è necessario l’assioma seguente. 


ZF6. ASSIOMA DELL’INFINITO. Definiamo la nozione di insieme x' seguente 
all'insieme x: x'=xUfx}. Esiste un insieme x contenente © e, insieme ad ogni 
yex, contiene y'. 


Pertanto questo assioma postula l’esistenza di un insieme contenente tutti i 


DD'D'D,.. 


ZF7. ASSIOMA DEL SOTTOINSIEME. Per ogni insieme x e per ogni proprietà P 
di un insieme esiste un insieme y tale che 3 € y se, e solo se, 2 ex e 2 gode della pro- 


prietà P. 


Si usa scrivere y = {z|z ex e 2 gode della proprietà P}. 

Nella formulazione di questo assioma per la prima volta appare la nozione 
generale «proprietà di un insieme» che noi non abbiamo definito. Qui ci tro- 
viamo di fronte essenzialmente a un problema linguistico; dobbiamo chiarire 
quali frasi del linguaggio naturale, contenenti il nome insieme x, siano da ri- 
tenere una descrizione delle proprietà dell’insieme x. Una risposta precisa può 
essere data solo dopo aver introdotto il linguaggio formale della teoria degli in- 
siemi. Noi ci limitiamo a far notare che queste frasi devono comprendere solo 
le notazioni di insieme, le parole «non», «e», «oppure», «se, ..., allora...», «se, 
e solo se», «esiste», «per ogni», «uguale», «essere elemento» e così pure i loro 
sinonimi e le parole ausiliarie del linguaggio naturale, e, infine, esse devono es- 
sere «costruite regolarmente». La difficoltà maggiore è chiarire cosa significa 
«costruzione regolare» di una frase. Farlo nei limiti del linguaggio naturale è 
oltremodo scomodo e questa è una delle ragioni principali che giustificano l’in- 
troduzione dei linguaggi formali. 

Sulle proprietà esiste un altro punto di vista complementare. Ogni pro- 
prietà di certi elementi, diciamo, di un insieme x, definisce in x, come si può 
mostrare, il sottoinsieme costituito dagli elementi che godono di questa pro- 
prietà. Inversamente, ogni sottoinsieme y C x definisce la proprietà «essere ele- 
mento di y». Perciò, d’accordo con questo punto di vista «estensionale», le 
proprietà degli elementi di x possono essere identificate con i sottoinsiemi 
di x. Però, se x è infinito, per esempio, se contiene J, 4°, @”,..., ne segue 
che tutti i sottoinsiemi di x risultano notevolmente di più che non tutti i sot- 
toinsiemi che possono essere esplicitamente descritti con frasi del linguaggio 
regolarmente costruite. In altre parole, esistono «proprietà», intese nel senso 
estensionale, non esprimibili per mezzo di nessun dato linguaggio. 

È proprio questa divergenza estensiva tra la nozione di « proprietà estensio- 
nale» e quella di «proprietà espressa nel dato linguaggio » che sta alla base della 
impossibilità di ritenere che i modelli delle teorie matematiche «ingenue», in 
particolare della teoria degli insiemi, riflettano tutti gli aspetti delle teorie in- 
genue. 

Bisogna ancora notare che l’assioma del sottoinsieme è piuttosto uno «sche- 
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ma di assiomi». Esso definisce la serie infinita dei suoi casi particolari che si 
ottengono sostituendo alla proprietà indefinita P, una dopo l’altra, le frasi che 
esprimono tutte le possibili proprietà. | 

Per esempio, se, quale proprietà P dell’insieme x, prendiamo «u è un ele- 
mento di v», l'assioma del sottoinsieme postula l’esistenza della intersezione 
y=x00. Lu . . 

Se, quale proprietà P, si prende la proprietà «u non è un elemento di v>, 


noi postuliamo l’esistenza del complemento y = x\q. n LA: 
Introduciamo ancora alcune importanti nozioni utilizzando l'assioma del 


sottoinsieme ed altri assiomi. l 
Il prodotto cartesiano x x y degli insiemi x e y può essere definito cosî: 


xXxy = {z]lzeP(P(xUy)) e esistono uex e vEY tali che 2 = 4, v)}. 


Pertanto x x y è costituito da tutte le coppie ordinate, il cui primo elemento ap- 
partiene ad x e il secondo a y. Osserviamo che, se uex e vEy, allora 


fu, 9} eP(xUy) e (, 0) = {{}.{w, v}}eP(P(£Uy)). 


Si chiama relazione binaria fra gli insiemi x, y ogni sottoinsieme di x X y. 

Si chiama applicazione f dell'insieme x in y (notazione: f :x+y), oppure 
funzione dall'insieme x all'insieme y una relazione binaria f x x y tale che per 
ogni uex esiste un unico elemento vey con la proprietà <u, v) € f. In tal caso 
spesso si scrive anche v = f(1). 


ZF8. ASSIOMA DELLA SOSTITUZIONE. Sia P una proprietà di coppie ordinate 
di insiemi tale che per tutti gli elementi x, y, 3 di un certo insieme u, se le coppie 
(x,y) e (x, 2) godono della proprietà P, risulti y=% Esiste allora un insieme ® tale 
che y ev se, e solo se, esiste xe u tale che la coppia x, y) gode della proprietà P. 


I presupposti relativi a P sono più deboli dei presupposti che definiscono 
una funzione. Ciò nonostante l’assioma postula sostanzialmente il fatto che P 
definisce una funzione su un conveniente insieme. Osserviamo che anche questo 
è uno schema di assiomi. 


ZF9. ASSIOMA DELLA RESTRIZIONE. Sta P una certa proprietà degli insiemi e 
supponiamo che esista un insieme con la proprietà P. Esiste allora un insieme x con 
la proprietà P tale che nessuno dei suoî elementi gode della proprietà P. 


È proprio da questo assioma che si può ricavare l'affermazione secondo la 
i ce fini 1 
quale ogni catena x, 3x3... deve essere finita. 


ZF10. ASSIOMA DELLA SCELTA. Per ogni insieme x non vuoto esiste una fun- 
zione 


F:{9lye9(2) e pad} 
tale che per ogni yeP (x), y# D, si ha: f(y) €y. 


In altre parole si postula l’esistenza di una funzione che sceglie un solo ele- 
mento da ogni sottoinsieme non vuoto dell’insieme x. i 
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Gli assiomi ZF1-ZFr1o formano il sistema completo di assiomi della teoria 
degli insiemi secondo Zermelo-Fraenkel nel linguaggio naturale. Esistono altre 
varianti di assiomatizzazione della teoria degli insiemi. Fra queste la più nota è 
l’assiomatizzazione di Gòdel-Bernays. In essa la nozione fondamentale è la 
«classe», mentre l'insieme è definito quale classe che può essere elemento di 
un’altra classe. Nella interpretazione standard nell’universo di Zermelo-Fraen- 
kel tutti gli insiemi formano una classe, ma non un insieme. Ogni proprietà 
degli insiemi, esprimibile nel linguaggio, definisce la classe di tutti gli insiemi 
che godono di questa proprietà. Questa classe pure non può essere un insieme. 
L’assiomatica di Gédel-Bernays non contiene schemi di assiomi e, pertanto, è 
più comoda dal punto di vista formale. Per il contenuto essa può essere utile 
nella moderna teoria delle categorie; per esempio, la categoria di tutti i gruppi 
forma una classe, ma non un insieme. È noto, tuttavia, che nella teoria di Gédel- 
Bernays sono deducibili esattamente gli stessi risultati sugli insiemi della teoria 
di Zermelo-Fraenkel, cosî che esse in sostanza sono equivalenti. 

Esaminiamo ora le nozioni metamatematiche introdotte nel paragrafo pre- 
cedente applicate al linguaggio e agli assiomi della teoria degli insiemi. 


5. Caratteristica metateorica della teoria degli insiemi. 


La semantica del linguaggio della teoria degli insiemi nella variante iniziale 
di Georg Cantor [1895-97] era legata alla rappresentazione mentale di oggetti di 
natura arbitraria del mondo reale, o del mondo delle idee, e alla possibilità di im- 
maginare collezioni diverse di tali oggetti come un tutto unico. Ognuna di queste 
collezioni è un insieme (termine standard scelto tra diverse espressioni sinonime 
del linguaggio naturale) e gli oggetti che ne fanno parte sono gli elementi di 
questo insieme. Da un tale punto di vista si potrebbe considerare, per esempio, 
l'insieme di tutti gli insiemi. Naturalmente esso deve contenere se stesso quale 
suo elemento. 

A Bertrand Russell appartiene il ragionamento che mostra come si possa 
giungere assai presto ad una contraddizione applicando a questo arco di rap- 
presentazioni mentali semplici costruzioni logiche. Infatti, consideriamo l’in- 
sieme X i cui elementi siano, tutti e soli, gli insiemi che non contengono se stessi 
quali propri elementi; per brevità li chiameremo insiemi «regolari». Poniamoci 
la domanda: è «regolare» X? Se X fosse «regolare», esso, per la definizione di 
«regolarità», non dovrebbe contenere se stesso quale suo elemento, ma ciò 
contraddirebbe la definizione di X quale insieme di tutti gli insiemi «regolari». 
D'altro lato, se X fosse «non-regolare», esso, per la definizione di «non-rego- 
larità », dovrebbe contenere se stesso quale suo elemento, ma ciò contraddirebbe 
la definizione di X quale insieme che contiene solo insiemi «regolari». 

Questo « paradosso » e quelli ad esso imparentati furono oggetto di numerose 
discussioni e disaccordi. Il modo meno radicale di uscirne fuori consistette 
nel restringere la semantica iniziale: bisognava ammettere che fossero insiemi 
non tutte le immaginabili collezioni di oggetti, ma soltanto alcune. Quello più 
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radicale, invece, consistette nella richiesta di rinunciare completamente alla 
semantica del linguaggio della teoria degli insiemi e, come corollario, allo stesso 
linguaggio. Poiché tale richiesta distrugge completamente l’edificio della ma- 
tematica classica e della maggior parte di quella contemporanea, pochi l’accol- 
sero. 

La semantica del linguaggio di Zermelo-Fraenkel, descritta all’inizio del 
paragrafo precedente, è il risultato di quella restrizione sulla rappresentazione 
degli insiemi che ci salva dal paradosso di Russell e, nello stesso tempo, per- 
mette di realizzare tutte le costruzioni matematiche. La collezione di Russell de- 
gli insiemi X che non contengono se stessi quali propri elementi, nell’universo 
di Zermelo-Fraenkel, è costituita da tutti gli insiemi dell’universo. Essa non è 
un insieme dell’universo; altrimenti avremmo Xe X, da cui si otterrebbe im- 
mediatamente la catena infinita di inclusioni X5X5X3..., che in questo uni- 
verso è impossibile. 

Ciò che è stato detto non significa che questa semantica standard sia comple- 
tamente accettabile. 

Da un punto di vista puramente logico non è dimostrato che nel sistema ZF 
non si possa giungere ad una contraddizione mediante ragionamenti forse 
notevolmente più lunghi di quello di Russell. Hilbert congetturò che la con- 
traddittorietà degli assiomi potesse essere dimostrata con metodi puramente 
finiti, considerando la teoria combinatoria dei testi nella versione formalizzata 
del linguaggio della teoria degli insiemi. Ma, come dimostrò Gédel, in ognuna 
di tali dimostrazioni bisogna usare mezzi molto potenti: la formalizzazione di 
questa dimostrazione, quale deduzione dallo stesso sistema di assiomi, è im- 
possibile. Ciò, per quanto concerne la non-contraddittorietà del sistema di 
assiomi di ZI, conduce a un circolo vizioso. 

Da un punto di vista più pragmatico è chiaro che l’universo di ZF contiene 
insiemi infiniti immensamente grandi, un’idea dei quali probabilmente è oltre- 
modo lontana dalla realtà fisica. Secondo la critica di Brouwer non vi è alcun 
fondamento di aspettarci che sia giustificato, o almeno sia sensato, applicare a 
questi insiemi la logica standard astratta dalle considerazioni di collezioni finite. 
Ciò conduce a forti dubbi sul fatto che a testi arbitrari nel linguaggio di ZF sia 
applicabile Pidea della loro verità-falsità persino indipendentemente dal fatto 
che si sia o meno in grado di stabilire questa verità, o falsità. 

Quest'ultima circostanza fu resa palese in modo particolarmente clamoroso 
con le dimostrazioni di Gòdel e di Cohen, secondo le quali nel sistema di ZF 
non è deducibile dagli assiomi né l’ipotesi del continuo di Cantor, né la sua 
negazione. Se si crede che essa sia vera, o falsa, è assolutamente incomprensibile 
su quali principî ciò possa essere stabilito e in che misura risultino accettabili 
tali principî. In ogni caso gli assiomi di ZF non possono costituire un sistema 
completo. 

Infine gli assiomi di ZF sono notoriamente non categorici. Infatti, Skolen 
ha dimostrato che ogni teoria formale, che ammetta generalmente una inter- 
pretazione, può essere interpretata nell'universo costituito semplicemente dai 
numeri interi e, per di più, in infiniti modi sostanzialmente diversi tra loro. 


ssi 
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In queste condizioni la maggioranza dei matematici assume la teoria degli 
insiemi, il suo linguaggio e la sua assiomatica, quale apparato per comunicare, 
fissare, scoprire e applicare i fatti matematici. Inoltre, con l’assunzione di que- 
sto linguaggio, si è aperta la possibilità di presentare la matematica come un 
tutto unico e di indagare tra le sue parti eterogenee una enorme quantità di 
legami stretti che precedentemente sfuggivano all’attenzione. Da questo punto 
di vista nessuna delle alternative proposte può competere con la teoria degli 
insiemi. 

Dobbiamo limitarci a constatare che lo sviluppo della matematica non ha 
rivelato contraddizioni nella versione della teoria degli insiemi che è stata as- 
sunta; inoltre che l’esperienza storica ci testimonia la possibilità, quando se ne 
ravvisi la necessità, di precisare e correggere le nostre idee sugli oggetti mate- 
matici senza, per questo, demolire alla radice l’edificio matematico. 


6. Limiti del metodo assiomatico. 


Abbiamo già notato all’inizio dell'articolo il posto e il ruolo del metodo as- 
siomatico sul piano teoretico generale. Le sue realizzazioni concrete nei diversi 
dominî del sapere formano tutto uno spettro, ad un estremo del quale vi sono 
le generalizzazioni teoretiche delle scienze umanistiche (probabilmente la tradi- 
zione è cominciata con l’Ethica dello Spinoza), mentre all’altro estremo vi sono 
le teorie formali della matematica moderna. 

Tuttavia, accanto allo straordinario sviluppo delle idee e della tecnica di 
questo metodo, nel xx secolo fu scoperta l’esistenza di limiti di principio sulle 
sue possibilità che stanno al fondo della questione. 

In questo campo la scoperta centrale è stata il teorema di G'odel sulla incom- 
bletezza degli assiomi dell’aritmetica [1931], il risultato e la dimostrazione del 
quale ammettono generalizzazioni significative. Descriviamo brevemente il con- 
tenuto di questo teorema. 

Consideriamo un linguaggio L sufficientemente formalizzato dell’aritmetica, 
che comprenda i mezzi per esprimere le operazioni elementari sui numeri interi, 
le nozioni logiche fondamentali e i segni per i numeri interi concreti e inde- 
terminati. 

Numeriamo tutti i testi di questo linguaggio regolarmente costruiti con 
numeri naturali, per esempio, secondo il principio di Leibniz-Gédel. L’unica 
condizione essenziale in tale «numerazione di Gòdel» consiste nel fatto che la 
ricostruzione del testo a partire dal numero e del numero a partire dal testo deve 
essere una procedura puramente meccanica, la cui attuazione possa essere af- 
fidata ad un calcolatore, avendo scritto per esso il programma corrispondente. 

Fissiamo anche un sistema di assiomi dell’aritmetica. Si suppone che dal 
numero del testo si possa riconoscere meccanicamente se esso è, oppure no, 
un assioma. 

Infine fissiamo nel linguaggio le regole d’inferenza. Anche la procedura per 
costruire, a partire dagli assiomi, tutti itesti deducibili deve essere meccanicizzata. 
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Si può dimostrare che in un'adeguata formalizzazione dei reali ragionamenti 
matematici tutte queste ipotesi sono soddisfatte. Di pit, si può argomentare il 
punto di vista consistente nel fatto che queste ipotesi devono essere soddisfatte 
in ogni adeguata formalizzazione. 

Indichiamo ora con 7 l’insieme dei numeri dei testi veri e con D l’insieme 
dei testi deducibili dagli assiomi. È naturale ritenere che DST. Il teorema di 
Gòdel afferma che questa inclusione è propria, cioè esiste sempre una affermazione 
vera dell’aritmetica non deducibile dagli assiomi. 

La sua dimostrazione è basata sull'unione di due principî. 


ESPRIMIBILITÀ DI D: esiste un testo P su L, comprendente il nome k di una va- 
riabile numerica intera, tale che RED se, e solo se, questo testo diventa vero dopo 
aver sostituito in esso il nome k con îl numero intero ky. (Diciamo che questo testo 
P esprime l’insieme D). 

NON ESPRIMIBILITÀ DI 7: per T un tale testo non esiste. 


La dimostrazione del primo principio richiede un lungo lavoro tecnico, 
ma sostanzialmente sfrutta semplicemente la possibilità della generazione mec- 
canica degli elementi di D uno dopo l’altro. Questa generazione può essere 
affidata a un calcolatore e la sua logica e la sua aritmetica si prestano a una com- 
pleta descrizione nel linguaggio L dell’aritmetica elementare. 

La dimostrazione del secondo principio è un impiego molto ingegnoso del- 
l’antico paradosso del bugiardo. Essa è fondata sul fatto che, per ogni testo P, 
si può costruire esplicitamente un nuovo testo Op, il cui significato è riferito 
con la descrizione seguente: Op afferma che il numero di Op non appartiene al- 
l’insieme espresso dal testo P. 

Usiamo ciò per stabilire la non-esprimibilità di 7. Supponiamo che 7° sia 
espresso da un testo P e giungeremo a una contraddizione. Per questo ponia- 
moci la questione della veridicità del testo Oy. 

Se il testo Qp è vero, dal suo significato segue che il numero di Qp non ap- 
partiene all'insieme espresso dal testo P, cioè all'insieme 7. Ma allora, per la 
definizione di 7, il testo Q, deve essere falso. 

Se invece il testo Op è falso, dal suo significato segue che il numero di Qp 
appartiene all’insieme espresso dal testo P, cioè all'insieme T. Ma allora, per 
definizione di 7, il testo Op deve essere vero. 

Ciò completa la dimostrazione del teorema di Gòdel. 

La non-esprimibilità di 7 fu dimostrata da Tarski. Gòdel usò un metodo 
più particolare che conduce a un risultato più preciso. Egli, quale testo P, prese 
il testo che esprime l’insieme D. In tal caso il testo Op afferma che «il numero di 
Op non appartiene a D», cioè «Op non è deducibile dagli assiomi». Il testo Op 
non può essere falso, altrimenti risulterebbe che O, è deducibile dagli assiomi 
e perciò vero. Ne segue che il testo Op è vero e, per il suo significato, non è 
deducibile dagli assiomi. Pertanto il metodo di Gòdel dà luogo a un infinito 
completamento degli assiomi dell’aritmetica con testi del tipo Qp senza che, 
con ciò, ad ogni tappa di questo processo il sistema di assiomi risulti completo. 

Per abbracciare tutta la verità solo sui numeri interi sono necessarie infinite 


È 
bi 
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nuove idee. Per quanto ricco sia il sistema di premesse da cui si parte, questa 
verità non può essere generata meccanicamente. In misura maggiore queste 
limitazioni sono applicabili in altri dominî del sapere. 

I successi della matematica e di settori matematicizzati delle scienze na- 
turali indussero molti profondi pensatori a sperare nell’esistenza di alcune leggi 
universali, dalle quali tutte le altre verità potessero essere semplicemente de- 
dotte teoricamente. Nella tradizione europea queste speranze sono legate ai no- 
mi di Leibniz e Cartesio e sono tuttora sostenute da parte di alcuni fisici che 
meditano sulla struttura della nostra conoscenza della natura. 

T'uttavia, dopo i lavori di Gòdel, possiamo essere certi che queste speranze 
sono infinite. Anche lasciando da parte la questione di quanto sia complesso il 
mondo, sappiamo che il metodo delle inferenze deduttive non è sufficientemente 
forte. 

Benché finora non siano stati esplicitamente indicati «problemi insolubili» 
(esempi di Gédel, ipotesi del continuo, problema dell’identità delle parole nei 
gruppi), lontani da quelli matematici, che stiano di fronte ai fisici, non è escluso 
che tali problemi fisici siano già stati affrontati. È possibile, per esempio, che le 
difficoltà di dedurre dalle equazioni della idrodinamica le caratteristiche di certi 
fenomeni realmente osservate siano effettivamente insuperabili: gli assiomi del- 
la teoria degli insiemi e l'apparato standard per tale deduzione possono non 
bastare. 

In queste condizioni diventano particolarmente chiari il ruolo dell’espe- 
rimento numerico e dell’osservazione e il ruolo dell’intuizione e della congettura 
con insufficiente fondamento. Essi sono chiamati non solo a compensare la 
nostra provvisoria incapacità di raggiungere la verità mediante inferenze de- 
duttive, ma forse anche a farci sapere che è impossibile conoscere la verità dedut- 
tivamente. Prima o poi dovremmo uscire dai limiti della «ragione pura». 

Questi limiti di principio del metodo assiomatico, connessi con l’incomple- 
tezza dell’informazione da esso fornita e con il dubbio permanente sulla sua 
verità e non-contraddittorietà, fanno parte del fondamento della moderna gno- 
seologia e devono essere esplicitamente riconosciuti. Solo in queste condizioni 
può manifestarsi tutta la forza di quell’unica arma dell’intelletto umano che è il 
metodo assiomatico. {JU. I. M.]. 
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Assiomi e postulati sono gli elementi fondamentali a partire dai quali, all’interno 
di teorie matematiche (cfr. matematiche), o più in generale di teorie ad esse assimila- 
bili, si procede deduttivamente per ottenere i risultati ricercati (cfr. strutture matemati- 
che, deduzione/prova, geometria/topologia ed anche fisica, quanta). A fondamento 
della matematica è posta abitualmente la teoria degli insiemi (cfr. insieme); per evitare 
antinomie e paradossi è opportuno vagliare accuratamente gli assiomi iniziali ed agire 
all’interno di un linguaggio formalizzato (cfr. formalizzazione). Nell’articolo che pre- 
cede si presenta come esempio la teoria di Zermelo-Fraenkel (cfr. applicazioni). Attra- 
verso il teorema di Gòdel, si accenna ai limiti intrinseci alle teorie formalizzate (cfr. 
logica, referenza/verità). Il rapporto tra teorie e teorie formalizzate è esaminato in 
particolare in teoria; più in generale cfr. anche scienza. La «difficoltà» dell'accordo 
tra teorie formalizzate da una parte e dialettica dall’altra è esaminata in dialettica. 
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La categoria continuo/discreto ha una caratterizzazione gnoseologica molto 
generale. Il discreto è legato all’isolamento, alla separabilità degli oggetti e dei 
fenomeni, alla possibilità di fissarli per mezzo di simboli in una comprensione in- 
dividuale e collettiva. Il modello matematico fondamentale del discreto è la suc- 
cessione dei numeri naturali, 1, 2, 3, ... Il continuo è legato alla possibilità di va- 
riazioni arbitrariamente piccole di questa o quella caratteristica, all'assenza di 
frontiere nette, di salti, alla connessione, ecc. Il modello matematico fondamen- 
tale del continuo è la retta reale, cioè il continuo dei numeri reali. 

Tra le più antiche e note considerazioni sul continuo/discreto vi sono i pa- 
radossi di Zenone di Elea (v secolo a. C.). Essi ci sono giunti nell’esposizione di 
Aristotele. Due, la «freccia» e «Achille», argomentano probabilmente l’impos- 
sibilità del moto in uno spazio-tempo continuo; prima di arrivare alla fine di un 
percorso un oggetto deve raggiungere la metà di questo percorso; quindi la metà 
del percorso rimanente e cosi via fino all'infinito. Altri due paradossi argomen- 
tano l'impossibilità del moto in uno spazio discreto: invero un oggetto in moto 
dovrebbe trovarsi e non trovarsi in uno stesso luogo. 

Nonostante tutta l’infuenza emozionale che i paradossi di Zenone hanno 
esercitato sui filosofi fino ai nostri tempi, bisogna subito convenire che non esi- 
stono né una loro interpretazione univoca, né un’unica idea su come li si dovrebbe 
risolvere. Il tentativo di trapiantare singoli frammenti dell’antica cultura umani- 
stica su basi moderne è quasi sempre accompagnato da tali fenomeni d’incompa- 
tibilità. Perciò, per gli scopi di questo articolo, convenzionalmente, possiamo 
ritenere che nei paradossi di Zenone furono posti alcuni problemi, la cui so- 
luzione era compito delle generazioni future [cfr. anche Griinbaum 1967]. 

Nel primo di essi si afferma l’inconcepibilità del movimento nell'ambiente 
spazio-temporale, sia continuo sia discreto. Benché nel testo di Zenone-Aristo- 
tele non si parli esplicitamente di ciò, si può supporre che sia proprio questo il 
senso dell’affermazione sull’impossibilità del moto. Zenone fu allievo di Parme- 
nide, che divulgò, probabilmente, l’identità tra il pensiero e l’essere, benché 
l’interpretazione della sua filosofia sia altrettanto non-univoca. 

Se si accetta quest’interpretazione di tali paradossi, si può dire che, per i suoi 
tempi, egli aveva ragione. Il movimento era inconcepibile nel senso che non esi- 
stevano né un apparato concettuale, né un linguaggio del pensiero sufficiente- 
mente sviluppati. Egli perciò rese evidente l’inadeguatezza e la povertà del lin- 
guaggio corrente in ordine a questo problema. L'apparato che occorreva fu ela- 
borato in modo coerente da Aristotele, da Eudosso e da Euclide. Galileo e New- 


ton iniziarono poi la nuova era moderna. Il moto meccanico negato da Zenone e 


forme di moto incomparabilmente più complesse, che egli nemmeno immagi- 
nava, sono descrivibili nel linguaggio della matematica e della fisica, che tiene 
conto tanto degli aspetti continui quanto di quelli discreti. Il moto divenne de- 
finitivamente concepibile. 
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Tuttavia il linguaggio della matematica e della fisica moderne ha una logica 
interna straordinariamente complessa e, in quegli aspetti ove ci si riferisce alle 
astrazioni dell’infinito e del continuo, la sua semantica è tutt’altro che chiara. 
L'infinito matematico e la continuità, che pure sono dotati di un’enorme forza 
chiarificatrice nelle scienze naturali, in nessun modo possono essere interpretati 
direttamente in termini dei dati sperimentali di queste scienze. Perciò si può ri- 
tenere che le difficoltà presenti nei fondamenti stessi della matematica sono le 
lontane eredi dei paradossi di Zenone. È, questo, il secondo problema che egli 
pose. I suoi sono un modello dei moderni paradossi dell’infinito e, probabilmente, 
gli argomenti degl’intuizionisti e dei costruttivisti potrebbero essere vicini, nello 
spirito, a quelli di Zenone. 

In quest'articolo ci si limiterà a descrivere il primo aspetto, sforzandosi di se- 
guire come si presenta il continuo/discreto nei dati sperimentali delle moderne 
scienze naturali e nei loro modelli teorici. 

Il primo paragrafo è dedicato alla fisica e ai suoi modelli; il secondo, ai pro- 
cessi d'informazione e al linguaggio nel senso più esteso della parola; il terzo, ad 
alcuni modelli matematici complementari del continuo/discreto, l’importanza 
dei quali nelle scienze naturali non è ancora chiara, ma non è improbabile che 
aumenti. 


I. Spazio, tempo, materia, energia. 


In questo paragrafo si vedrà in che modo si manifestano gli aspetti del conti- 
nuo/discreto nel quadro generale del mondo cosi come esso è delineato dai dati 
della fisica moderna. Questo quadro non è omogeneo; si presenta come una gerar- 
chia di numerosi livelli\ognuno definito dalle sue peculiari unità di misura spazio- 
temporali. Per descrivere la natura a questi livelli sono stati elaborati diversi mo- 
delli fisico-matematici, nei quali a volte si sottolineano le caratteristiche continue 
del quadro osservato, altre volte quelle discrete; oppure esse vi vengono sintetiz- 
zate, come accade nell’apparato della meccanica quantistica. La frammentarietà 
delle attuali conoscenze fisiche è una circostanza ben nota: non abbiamo una teo- 
ria che possa pretendere, anche solo provvisoriamente, di descrivere universal- 
mente e conseguentemente la natura a tutti i suoi livelli, benché si creda che i prin- 
cipî della meccanica quantistica siano applicabili universalmente. Uno dei pro- 
blemi chiave nei tentativi di descrizione unitaria del macro- e del micromondo 
consiste appunto nella difficoltà di far concordare il quadro geometrizzato dello 
spazio-tempo macroscopico, in cui domina l’aspetto della continuità, con il qua- 
dro quantistico del micromondo, dove hanno un ruolo fondamentale il discreto e 
la discontinuità dei microfenomeni e il carattere probabilistico dei salti quantici. 

Più oltre si esporranno brevemente, nei limiti del necessario, la fenomenologia 
e i modelli dei diversi livelli del mondo osservato. 


lesione vi 
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1.1. Fenomenologia. 


«A misura d’uomo ». Le unità di misura standard di lunghezza, tempo e for- 
za, cioè centimetro, secondo e grammo, corrispondono all'ordine di grandezza del 
corpo umano e alla qualità della nostra esperienza quotidiana. Tra gli ordini di 
grandezza 10-* e 10' cm si colloca la maggior parte degli oggetti naturali e ar- 
tificiali con i quali l’uomo ha avuto a che fare nel corso della maggior parte del 
suo sviluppo: oggetti d’uso quotidiano, strumenti di lavoro, abitazioni, insetti, 
fauna e flora. Le prime idee sul discreto si formarono con la consapevolezza che 
questi oggetti sono separati l’uno dall’altro, dotati di limiti spaziali e di esistenze 
temporali distinte. Queste idee si sono concretizzate in quelle conquiste della 
cultura umana quali il «far di conto» con i numeri naturali (all’inizio piccoli), 
il linguaggio articolato e i rudimenti della scrittura; nei sistemi di comunicazione 
dell’uomo apparvero i segni sonori, grafici ed altri (cfr. oltre). 

L’intorno spaziale più vicino all'uomo, quello accessibile direttamente alla 
conoscenza mediante gli organi sensoriali (eccetto la vista, le cui possibilità sono 
incomparabilmente maggiori), possiede le stesse dimensioni caratteristiche. La 
parte «vuota» (cioè riempita dall’atmosfera) di questo intorno, dove è possibile, 
senza impedimenti, il moto dell’uomo, degli animali e degli oggetti — il moto che 
si sviluppa nel tempo e il cui corso non presenta salti osservabili e frontiere — 
tutto ciò fu alla base delle prime idee sulla continuità. Occorsero decine di mil- 
lenni di sviluppo dell’umanità affinché queste idee si formulassero nelle nozio- 
ni di «spazio vuoto» assolutamente continuo, omogeneo, uniforme, e di «tempo 
vuoto» che dall’epoca di Newton restano una delle foridamentali generalizzazio- 
ni della fisica. 

Lo spazio reale sopra la superficie della Terra è interrotto da villaggi, fiumi, 
boschi e monti. Il tempo reale è contrassegnato dal succedersi di notti, giorni, 
stagioni, generazioni, Questi processi naturali furono all'origine del calcolo e del- 
le misurazioni, cioè delle primitive sintesi del discreto e del continuo. 

In confronto alle dimensioni naturali del corpo umano, nello spazio e nel tem- 
po, le possibilità energetiche dei suoi organi sensoriali presentano un aspetto 
sostanzialmente nuovo. Quella che è in pratica la più piccola unità di lavoro de- 
rivata dalle unità fondamentali, cioè il grammo-peso, si trova effettivamente 
quasi al limite inferiore delle facoltà meccaniche dell’uomo. Invece i suoi or- 
gani sensoriali, e tra essi l’udito e in particolare la vista, sono in grado di perce- 
pire e distinguere quantità di energia incomparabilmente più piccole. Secondo 
indagini moderne l’occhio, completamente adattato al buio, reagisce in modo si- 
curo a una quantità di luce corrispondente a cinque o sei fotoni, che sono le più 
piccole unità discrete di energia luminosa. Solo per questo siamo in grado di ve- 


. dere oggetti cosi lontani come le stelle. E, già da molto tempo, l'elaborazione delle 


rivelazioni dell’occhio da parte del cervello ci ha permesso di sentirci parte di un 
mondo immensamente pit grande di noi. T'uttavia la comprensione che l’energia 
luminosa e quella acustica hanno natura comune con quella meccanica è un’acqui- 
sizione molto tarda della cultura umana: le prime dimostrazioni sicure di questo 
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fatto sono state ottenute venti-trent’anni fa. Il ruolo dei nostri organi di senso va 
ben oltre quello di «misuratori», o «trasduttori», di lavoro; essi ci procurano 
un'enorme quantità d’informazioni che, per valore, è incomparabile con le mi- 
sure energetiche dei deboli flussi di azioni. Agli aspetti continui/discreti dei pro- 
cessi d’informazione è dedicato in modo speciale il paragrafo seguente. 


Dimensioni astronomiche e cosmologiche. L’osservazione dei corpi celesti ri- 
sale alle primissime tappe della civilizzazione umana. Tuttavia la comprensione 
della loro natura e delle vere dimensioni spaziali e temporali della loro esistenza è 
frutto degli ultimi secoli. . 

La Terra è approssimativamente una sfera di raggio 10° cm. Il corpo celeste 
più importante per i processi terrestri è il Sole, che si trova a una distanza di 
1,5-10! cm. Il sistema solare nel complesso ha un diametro cento volte più gran- 
de: da Plutone ci divide una distanza di circa 2 - 10!5 cm. La stella più vicina è a 
una distanza di circa 4,510! cm. Una comoda unità di lunghezza per misurare 
le distanze infrastellari è l’anno luce, che è lo spazio percorso dalla luce in un 
anno. Un anno luce è circa 10! cm. 

Il Sole, il sistema planetario e le stelle ad esso pit vicine sono una parte insi- 
gnificante di un enorme collettivo di stelle e nebulose che insieme formano la no- 
stra Galassia, la cui massa fondamentale costituisce la Via Lattea. Grosso modo la 
Galassia è a forma di lente biconvessa con un diametro intorno ai 10° anni luce 
e uno spessore di circa 1500 anni luce. Essa contiene circa 10!! stelle. Noi ci tro- 
viamo alla periferia della Galassia, a circa 3 + 104 anni luce dal suo nucleo e a 30 
anni luce dal suo piano equatoriale. Nella Galassia le stelle sono distribuite in 
modo assai difforme; la densità al centro è decine di migliaia di volte quella in- 
torno a noi. Gli oggetti come la nostra Galassia si contano attualmente a miliardi 
e sono riuniti, pare, in un enorme sistema, la Metagalassia. Le galassie più vicine 
formano le Nubi di Magellano e sono lontane da noi circa 2- 10° anni luce, cioè 
una distanza il cui ordine di grandezza coincide con le dimensioni della nostra 
Galassia. Le più lontane galassie osservate si trovano a una distanza di miliardi 
di anni luce. Nel 1929 Hubble determinò le distanze di una ventina di galassie e 
ne misurò le relative velocità radiali. Risultò che tutte queste galassie si allonta- 
nano da noi con una velocità approssimativamente proporzionale alla distanza. 
Il coefficiente di proporzionalità, cioè la costante H di Hubble, in base alle misu- 
razioni attuali, ammonta a 55- 10° cm/sec per ogni 3,3 - 108 anni luce di distanza. 
Tra l’altro questa cifra è stata più volte rivista. Estrapolando questo moto a tutta 
la parte visibile dell'Universo e al lontano passato, si ricava che circa 10!° anni 
fa l'Universo era concentrato in uno spazio molto piccolo; poi cominciò ad espan- 
dersi in modo simile a un’esplosione e questa espansione è tuttora in atto. 

Nelle dimensioni cosmiche e in prima approssimazione, il nostro mondo si 
presenta pertànto, nel continuo spazio-temporale, come evoluzione di mate- 
ria, distribuita in modo niente affatto uniforme, che presenta caratteristiche di 
discretezza a diversi livelli dimensionali. I corpi celesti sono oggetti nettamente 
distinguibili; in essi la densità della materia oscilla fondamentalmente tra i limiti 
di 10-19-10? g/cm?, mentre la distanza fra le stelle, per esempio nell’intorno del 
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Sole, supera 10? volte il loro raggio. A sua volta, nelle dimensioni delle galassie 
(10° cm), la densità media della materia è dell'ordine di 10-? g/cm, mentre a 
livello delle distanze fra le galassie essa è inferiore di tre-quattro ordini. Infine, 
nelle dimensioni di 10?5-10° cm, la distribuzione media della materia diventa 
come se fosse omogenea e isotropa. Lo spazio cosmico che divide i coaguli di ma- 
teria non è niente affatto vuoto; oltre alla polvere interstellare e ai gas, in esso vi 
sono i campi. Le oscillazioni del campo elettromagnetico, cioè la luce e le radio- 
onde, sono per noi la sorgente fondamentale delle conoscenze sul mondo. I campi 
gravitazionali, cioè i campi delle forze di gravità, legano tra loro i coaguli di materia 
e, secondo le concezioni della teoria generale della relatività di Einstein, defini- 
scono la geometria generale dello spazio-tempo. Lo spazio è poi attraversato da 
flussi di radiazione cosmica e di neutrini. Essi sono portatori contemporanea- 
mente di massa e di energia, legate tra loro dalla relazione fondamentale di Ein- 
stein E=mc" (in cui E è l’energia, m la massa e c la velocità della luce). La descri- 
zione macroscopica dei campi sottolinea il loro aspetto continuo. Cosî, il campo 
elettromagnetico è descritto dalla posizione dei vettori delle intensità delle com- 
ponenti elettrica e magnetica che variano nel tempo e nello spazio in accordo con 
le equazioni differenziali di Maxwell. La descrizione dei campi (e della materia) 
secondo la meccanica quantistica sottolinea l'aspetto discreto: il campo elettro- 
magnetico è descritto quale «gas di fotoni», quanti di radiazione che si muovono 
con la velocità della luce. Su ciò si tornerà più avanti. 


Dimensioni atomico-molecolari. Nelle dimensioni di 10-#-107* cm sono com- 
prese le più piccole unità della vita: le cellule, i microorganismi, i virus. La vita, 
quale oggetto delle scienze biologiche, è straordinariamente complessa e nel suo 
studio non ci siamo ancora allontanati da un livello puramente descrittivo. E, 
a un tale livello, in ogni scienza l’aspetto discreto è un portato della stessa ne- 
cessità di classificare i fenomeni studiati, d’individuare le unità strutturali, gli or- 
gani, i processi elementari. Una delle più grandi generalizzazioni della biologia 
fu l’individuazione delle cellule quali unità strutturali fondamentali di tutto ciò 
che vive. Dal punto di vista del tema di questo articolo i dati biologici più inte- 
ressanti si riferiscono, probabilmente, alla trasmissione delle informazioni nei si- 
stemi viventi; ad essi sarà dedicato il paragrafo seguente. Qui, invece, tralasciando 
il livello biologico, conviene passare al micromondo della chimica e della fisica, 
ricordando anzitutto le idee fondamentali sugli atomi e le molecole. 

Nell’aspetto macroscopico le «sostanze pure » dei chimici, come l’acqua, for- 
niscono gli esempi più tipici della continuità, della omogeneità e della divisibilità 
delle sostanze. La questione se questa divisibilità sia illimitata ha occupato da 
tempi remoti un posto importante nelle costruzioni della filosofia naturale. Il suo 
esame ha condotto già nell’antichità all’idea speculativa degli atomi quali più 
piccole unità delle sostanze non ulteriormente divisibili. L'ipotesi sugli atomi 
forni una spiegazione qualitativa verosimile di effetti quali la compressibilità 
delle sostanze, l’esistenza delle soluzioni, la presenza dei tre stati solido, liquido e 
gassoso. Nella terminologia moderna si chiamano atomi le più piccole unità di un 
elemento chimico, mentre le più piccole quantità di sostanze pure, unione di ele- 
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menti, si chiamano molecole e sono costituite da atomi legati tra loro. Nel xx se- 
colo furono costruite le prime teorie quantitative, in cui le ipotesi sugli atomi e le 
molecole assunsero lo stato di concetti concordanti e dotati di una grande forza 
chiarificatrice. Fra esse vi è la «legge delle proporzioni multiple» per le sostanze 
pure: per esempio, in ogni volume d’acqua le componenti in peso comprendono 
due unità d’idrogeno e una unità (mole) di ossigeno. Ancora, l’ipotesi che un gas 
sia costituito da molecole che si muovono in modo caotico ha permesso a Maxwell 
e Boltzmann di chiarire teoricamente le leggi sperimentali sul comportamento dei 
gas. Probabilmente il culmine di questo periodo fu il calcolo del famoso numero 
di Avogadro, 6 - 10%, che esprime la quantità di molecole presenti in una mole di 
qualunque gas. Questa costante cosf grande stabilisce il primo legame tra il mi- 
cro- e il macromondo. Grazie alla sua grandezza è possibile uno dei più diffusi 
meccanismi di formazione di macroeffetti continui quale risultato di una media 
su microeffetti discreti. È, questo, l'oggetto della fisica statistica. 

Il dominio tra 1079 e 107” cm si riferisce alle dimensioni molecolari: dalle più 
grosse molecole proteiche all’atomo. Nelle indagini scientifiche reali si usa tutto 
uno spettro di modelli funzionali di molecole e di atomi. Ad un estremo di que- 
sto spettro vi sono veri e propri modelli (di legno, di plastica e di metallo) di gros- 
se molecole, in cui gli atomi sono rappresentati da sferette rigide di dimensioni 
definite e sono rigidamente fissati nella molecola da vincoli infratomici, le cui lun- 
ghezze e angoli reciproci sono noti e costanti. Nei modelli più realistici l'atomo è 
immaginato nella forma di un nucleo rigido del diametro di circa 10-!8 cm circon- 
dato da una nube di elettroni, suddivisa in orbite elettroniche che possono defor- 
marsi e riunirsi dentro la molecola, formando dei vincoli non rigidi a guisa di 
molle. Nelle molecole gli atomi possono oscillare attorno alla loro posizione me- 
dia; i vincoli pure possono oscillare e ruotare. Modelli ancor più realistici richie- 
dono di passare a un linguaggio del tutto diverso: quello fortemente matemati- 
cizzato della meccanica quantistica che, a sua volta, ammette descrizioni con di- 
versi gradi di precisione. In questo linguaggio una molecola, o un atomo, possono 
essere descritti da una funzione w a valori complessi (funzione d’onda o di stato), 
dipendente da una serie di parametri continui (le coordinate degli elettroni, dei 
nuclei e del tempo) e da una serie di argomenti discreti (per esempio, lo spin), 
la cui evoluzione tra un’interazione e un’altra è definita dall’equazione differen- 
ziale a derivate parziali di Schròdinger, e per effetto delle interazioni avvengono 
salti quantici probabilistici della funzione di stato W descritti da speciali regole 
supplementari (cfr. oltre). 

Le proprietà degli atomi non risultarono quelle che ci s’immaginava nell’anti- 
chità e persino all’epoca di Newton. 

Prima di tutto gli atomi sono divisibili; essi sono costituiti da un nucleo cir- 
condato da una nube di elettroni e, a sua volta, il nucleo è formato da protoni e 
neutroni. A livello atomico e subatomico entriamo in un ambito dominato netta- 
mente dalle caratteristiche discrete della materia e dell'energia e ciò si nota parti- 
colarmente nelle descrizioni fenomenologiche. La loro sintesi con gli aspetti 
continui si raggiunge solo al livello fortemente matematicizzato della teoria quan- 
tistica. Ecco una lista di alcune fondamentali proprietà discrete. 
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Struttura del nucleo. Due caratteristiche numeriche fondamentali dell’a- 
tomo sono il numero di massa A, uguale alla quantità totale dei protoni (carichi 
positivamente) e dei neutroni (neutri) nel nucleo, e il numero atomico Z, uguale 
al numero dei protoni nel nucleo, che coincide con il numero degli elettroni nel- 
l’atomo. Le proprietà chimiche di un atomo sono essenzialmente definite dal nu- 
mero atomico Z che può assumere i valori da Z= 1 (idrogeno) a Z= 103 (lau- 
renzio) e, probabilmente, maggiori. Gli atomi con grandi valori di Z sono insta- 
bili. Per un dato Z il numero di massa A può assumere diversi valori in seguito 
alla variazione della quantità di neutroni nel nucleo; si hanno cosi i diversi isotopi 
di un elemento con un dato Z. Le proprietà chimiche degli atomi rivelano una de- 
terminata periodicità dipendente da Z, che fu scoperta prima di essere chiarita 


in base alla teoria atomica e fu alla base della disposizione degli elementi nella 
tabella di Mendeleev, 


Nubi elettroniche. Un comodo modello della struttura della nube elettronica 
nell’atomo, che chiarisca in particolare la struttura discreta degli spettri atomici, 
parte dall’ipotesi che, al crescere di Z, nuovi elettroni riempiono gradatamente 
gli strati usualmente indicati con le lettere X, L, M, N, ... L’atomo dell’i- 
drogeno contiene un elettrone nel K-strato; l'atomo dell’elio, due elettroni nel 
K-strato; l'atomo del litio, due elettroni nel K-strato e uno nell’L-strato. Il 
K-strato non può contenere più di due elettroni; all’L-strato è diviso in due sot- 
to strati, 25 e 2), il primo dei quali non può contenere più di due e il secondo più 
di sei elettroni. Nell’atomo del neon (Z= 10) il K-strato e all’L-strato sono pieni. 
Le proprietà chimiche di un elemento sono definite in misura notevole da quanto 
è riempito l’ultimo strato. 

In una teoria più raffinata la nube elettronica attorno al nucleo è descritta da 
una funzione di stato ) dipendente da 3Z argomenti spaziali e da 2Z argomenti 
che assumono due valori (gli spin degli elettroni). Il quadrato del modulo della 
funzione di stato + fornisce la densità spaziale della nube elettronica e in questa 
densità non è cosî facile scorgere la struttura della nube. Infatti i numeri di elet- 
troni che riempiono gli strati sono alcune caratteristiche matematiche di simme- 
tria di questa funzione di stato (si vedano alcuni particolari al $ 1.3). 


Livelli di energia. Ogni microsistema, quale l’atomo, la molecola, il nucleo, 
ecc., può trovarsi in stati energetici diversi caratterizzati in particolare dal livello 
di energia E «accumulata» nel sistema stesso. Lo stato fondamentale di un siste- 
ma corrisponde a quello con energia minima ed è il più stabile. La descrizione del- 
le nubi elettroniche data sopra si riferiva allo stato fondamentale dell'atomo. Sotto 
l’azione di un campo elettromagnetico un sistema può passare ad uno stato ecci- 
tato con energia più grande, assorbendola dal campo, e, al contrario, può passare 
a un livello energetico inferiore, emettendo una parte di energia sotto forma di 
radiazione elettromagnetica. 

I livelli di energia di tali sistemi, quali l'atomo e il nucleo, hanno compo- 
nenti discrete e continue. Per esempio, i livelli di energia dell'atomo dell’idrogeno 
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sono E,= — R/n?, doven>1 è un numero intero e R è la costante di Rydberg. Lo 
stato fondamentale corrisponde a n= 1. Quando l’atomo passa dallo stato al- 
lo stato m si ha un’emissione luminosa di energia E, — E, (per n>m), oppure un 
assorbimento di energia E,,— E, (per n<m). Queste quantità di energia corri- 
spondono alle linee spettrali. La posizione della linea è definita dalla frequenza 
della luce e il legame tra frequenza ed energia è dato dalla relazione E = ly, dove 4 
è la costante di Planck. Le energie E>o formano una semiretta continua e corri 
spondono agli stati ionizzati dell’atomo dell’idrogeno, quando l’elettrone non è 
legato al nucleo. ; 

La costante di Planck, 41= 6,626 - 107°” erg-sec, chiamata anche quanto d’a- 
zione, è una costante fondamentale che appare nella descrizione di tutte le pro- 
prietà discrete del micromondo. La maggior parte delle caratteristiche della ma- 
teria e dell’energia, che nella teoria classica si immaginano distribuite in modo 
continuo e in quella quantistica in modo discreto, possono assumere valori pro- 
porzionali ad 4. Poiché questa costante è molto piccola, in molte osservazioni ma- 
croscopiche tali livelli discreti risultano praticamente indistinguibili, ciò che for- 
nisce una continuità approssimata. Da questo punto di vista il ruolo della co- 
stante di Planck è simile a quello del numero di Avogadro. Però, mentre quest ul- 
timo ammette un’interpretazione completamente classica in termini di «conteg- 
gio» delle singole molecole in un volume di gas, la costante di Planck, invece, ri- 
flette aspetti della struttura della materia essenzialmente nuovi e che, di fatto, 
non possono essere espressi nel linguaggio della fisica classica. —— 

Consideriamo alcuni fenomeni, per spiegare i quali è necessario introdurre 
la costante di Planck. 


Fotoni-quanti di radiazione elettromagnetica. La costante hè stata scoperta 
da Planck nel 1900 a conclusione dei tentativi di chiarire le leggi sperimentali della 
radiazione, cioè il carattere della dipendenza della lunghezza d onda, con densi- 
tà massima di radiazione, dalla temperatura del corpo irradiante. Risultò che la 
formula teorica esatta si ottiene se si suppone che l’atomo, considerato quale 
oscillatore con frequenza v, può ricevere o emettere solo porzioni ly di energia. 
Più tardi tali porzioni furono chiamate fotoni (di frequenza v). In ben noti limiti 
essi possono essere riguardati come particelle di massa nulla che si muovono con 
la velocità della luce. Un atomo allo stato eccitato può passare a quello fonda- 
mentale e in tal caso, passando un elettrone da una nube più alta a una più bassa, 
l’atomo emette un fotone. Al contrario, un atomo può assorbire un fotone e, co- 
me risultato, uno dei suoi elettroni passerà a un livello energetico superiore, op- 
pure lascerà del tutto l’atomo. Quest'ultimo fenomeno si chiama effetto fotoelet- 
trico (esterno) e la spiegazione delle sue leggi quantitative, dovuta ad Einstein 
(1905), fu la seconda fondamentale conferma dell’ipotesi di Planck. i l 

I dati sperimentali suggerivano che, illuminando un metallo, l’energia degli 
elettroni espulsi dagli atomi dipende solo dalla frequenza («dal colore ») della 
luce e non dalla sua intensità. In generale non si ha emissione elettronica finché 
la frequenza v non supera un certo valore critico; dopo di che si ha l'emissione e 
l’energia degli elettroni che abbandonano gli atomi è della forma E= Da W. La 
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causa di ciò sta nel fatto che, fino a quando i quanti della radiazione incidente sono 
minori dell’energia di fuga W, l’elettrone non può essere espulso, poiché esso as- 
sorbe energia solo in porzioni del valore di Av. Dopo di che, assorbendo un quanto, 
l’elettrone lascia l'atomo con un’energia uguale a 4v—W. I quanti sono indi- 
visibili. 


Dimensioni nucleari e subnucleari. Essere penetrati nella struttura della ma- 
teria nelle dimensioni al di sotto di 10-!? cm è il più importante successo della 
fisica degli ultimi decenni. Ciò ha richiesto la creazione di nuovi mezzi tecnici e di 
un linguaggio della fisica nuovo e ancora ben lontano dall’essere completo. La 
stessa fenomenologia di questo vastissimo mondo, i-cui dati sono ottenuti da os- 
servazioni con l’aiuto di acceleratori ad alta energia, da intuizioni teoriche audaci, 
da sottili esperimenti e mediante lunghi calcoli automatici, è eccezionalmente 
complessa. Le nozioni fondamentali di questa fenomenologia sono le particelle 
elementari, le loro interazioni e i campi. Attualmente sono note alcune centinaia 
di particelle elementari e di esse e delle interazioni cui partecipano si ha una clas- 
sificazione fenomenologica frammentaria. 

Le particelle elementari sono attualmente le ultime unità strutturali note della 
materia-energia nel senso seguente. 

La divisione della materia può essere spontanea, o risultato di un’interazione 
con passaggio di energia tra masse diverse di materia stessa. A livello macrosco- 
pico il modello di suddivisione si presenta come un frazionamento meccanico in 
seguito ad urti. A livello molecolare e atomico la divisione della materia avviene 
nei processi di vaporizzazione (energia calorifica), scomposizione chimica, ecc. 

La separazione degli elettroni dagli atomi avviene, per esempio, nel riscalda- 
mento dei metalli, oppure nei processi fotoelettrici (energia di radiazione elet- 
tromagnetica). 

La divisione del nucleo può essere sollecitata da un suo bombardamento con 
particelle ad alta energia e può avvenire anche spontaneamente. 

Ci si potrebbe attendere che ulteriori processi di divisione delle particelle 
elementari possano essere osservati, per esempio, come conseguenze di urti re- 
ciproci. Invece la situazione reale risulta qualitativamente diversa. Precisamente, 
se l'energia d’urto delle particelle non è grande, può semplicemente variare il 
carattere del loro moto («urto elastico »). Se invece è grande, cioè se, riferita alla 
massa secondo la formula E=mc?, diventa confrontabile con la massa della par- 
ticella elementare, al posto della sua rottura possono generarsi nuove particelle, 
quanti di radiazione, e cosf pure possono verificarsi varie mutazioni di particel- 
le in altre. In modo molto approssimato si può dire che, quando l’energia d’urto 
necessaria per spezzare la particella è confrontabile con la massa della particella 
stessa, invece della rottura si verifica la creazione di nuove particelle, nelle quali 
si materializza questa energia d’urto. 

Per esempio, l’urto di due protoni può produrre due protoni e due mesoni x 
(pioni), oppure i cosiddetti iperoni. Un quanto di radiazione può generare nel 
campo elettromagnetico di un atomo una coppia di particelle costituita da un 
elettrone e un positrone. Al contrario, questa coppia, in un urto, può annichilarsi 
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generando due (o più) quanti di radiazione. Attualmente viene osservata speri- 
mentalmente una quantità enorme di tali interazioni; sono studiate le probabilità 
di diversi «canali di reazione »; sono registrati i loro prodotti e tutto ciò costituisce 
la fenomenologia del mondo delle particelle elementari. 

Le particelle elementari sono stabili in misura diversa. Protoni, elettroni S fo- 
toni sono ritenuti assolutamente stabili. Un neutrone libero, invece, si scinde 
spontaneamente in un protone, un elettrone e un antineutrino in media dopo 
diciassette minuti, mentre un pione neutro vive circa 107! sec, dopo di che si 
scinde o in due fotoni (con una probabilità intorno a 0,988), oppure in un fotone, 
un elettrone e un positrone. A ogni particella elementare corrisponde un’anti- 
particella. È, questa, una manifestazione di una certa fondamentale simmetria 
delle leggi fisiche. L’elettrone e il positrone sono antiparticelle l’una dell altra; 
l’«antifotone » coincide con il fotone; l’antiparticella del neutrone si chiama ap- 
punto antineutrone. . 

A seconda della massa a riposo le particelle sono suddivise nelle seguenti 
classi fondamentali: 


a) fotoni, con massa a riposo nulla; , I 

b) leptoni (particelle leggere): vi appartengono l’elettrone e il positrone, i 
mesoni p, il neutrino e l’antineutrino; 

c) mesoni: pioni, kaoni, mesoni e altre; l . 

d) barioni: protone e neutrone, gli iperoni e le loro antiparticelle. 


.Sono pure note moltissime particelle enormemente instabili, spesso trattate 
quali risonanze, cioè quali stati eccitati di particelle più stabili. 3 

Del comportamento delle particelle elementari negli urti, in sistemi tipo 
atomo e nucleo, e cosi pure dei decadimenti, sono responsabili tre tipi d’intera- 
zioni: elettromagnetiche, deboli e forti. Alle interazioni elettromagnetiche par- 
tecipano immancabilmente i fotoni, che sono i loro veicoli. Le interazioni deboli 
sono caratterizzate dal fatto che vi partecipa il neutrino, oppure dal fatto che non 
si conserva un particolare numero quantico, la «stranezza» (si veda più avanti). 
Le interazioni forti sono caratteristiche dei processi che interessano il nucleo ato- 
mico e i loro veicoli sono pioni e altre particelle, che prendono il nome di adroni. 
Fotoni e leptoni non partecipano a interazioni forti. Re ; 

Le interazioni tra particelle elementari sono soggette a leggi di conservazione 
di una serie di specifici numeri quantici discreti, che nei sistemi di particelle ele- 
mentari sono additivi. Per esempio, in tutte le interazioni si conserva la carica 
elettrica totale, che assume valori multipli della carica dell’elettrone e. Inoltre, in 
tutte le interazioni si conserva il numero barionico, uguale a o per il fotone, i lep- 
toni e i mesoni; a +1 per il protone, il neutrone e cinque iperoni; ea 1 per le 
corrispondenti antiparticelle. La conservazione del numero barionico spiega fe- 
nomenologicamente la stabilità del protone: essendo il più leggero dei barioni, 
esso, in virtii di questa legge di conservazione, non può decadere in particelle più 
leggere. Nelle interazioni forti ed elettromagnetiche si conserva anche la cosid- 
detta ipercarica, che però può non conservarsi nelle interazioni deboli. Infine si 
conserva sempre la carica leptonica. 
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Riassumendo, si può dire che nel mondo delle particelle elementari domi- 
nano le leggi di tipo discreto che definiscono lo spettro delle loro masse, i tipi 
d’interazione e di canali di reazione e le leggi di conservazione. A fondamento 
della meccanica quantistica vi sono le idee sulle funzioni d’onda (o di stato) e 
sui campi operatoriali che si evolvono nel continuo spazio-temporale e le caratte- 
ristiche discrete legate alle loro proprietà di simmetria, singolarità e risonanza che 
saranno discusse nel $ 3. 


1.2. Modelli teorici della macrofisica. 


Nei modelli fondamentali della fisica del macromondo gli eventi hanno luogo 
nell’ambiente «continuo » dello spazio-tempo. I corpi materiali sono spesso sosti- 
tuiti da particelle puntiformi, il cui moto è governato da equazioni differenziali 
ordinarie (meccanica). I mezzi continui sono modellati da campi scalari, vetto- 
riali o più complessi, la cui struttura spazio-temporale è definita da equazioni 
differenziali alle derivate parziali (teoria dei campi). I mezzi, quali i gas e i li- 
quidi, possono essere riguardati come se fossero costituiti da un gran numero di 
particelle classiche (molecole) e sorge cost il problema di ricavare delle equazioni 
«di campo » mediate a partire dalle equazioni meccaniche del moto delle singole 
particelle (fisica statistica). In questo ambiente continuo le caratteristiche discre- 
te, o discontinue, del moto possono presentarsi sotto forma di non-omogeneità e 
di «stati legati» della materia, quali le stelle, il sistema solare, le transizioni di 
fase, oppure sotto forma di singolarità dei campi (valori che tendono all’infinito, 
discontinuità, onde d’urto), oppure sotto forma di risonanze, di pacchetti d’onda, 
o ancora sotto altre forme. In questo paragrafo si prenderanno brevemente in 
esame tali effetti. 


Modelli dello spazio-tempo. In tutte le teorie fondamentali della fisica mo- 
derna lo spazio-tempo è modellato mediante varietà differenziabili a quattro di- 
mensioni con questa o quella struttura complementare. Si ricordi (cfr. l'articolo 
«Applicazioni » di questa stessa Enciclopedia) che una tale varietà può essere defi- 
nita assegnando: a) un insieme M di punti; è) un atlante su costituito da una 
famiglia di carte, ognuna delle quali rappresenta un sistema di coordinate 
(%1, X2, x3, x4) che identifica un certo intorno di un punto di M con un certo in- 
sieme aperto di R'. Queste carte devono ricoprire tutto /M e nell’intersezione di 
due carte il passaggio da un sistema di coordinate all’altro deve essere dato da 
funzioni differenziabili. 

L’astrazione fisica corrispondente a un punto di M è un evento localizzato 
in un punto dello spazio e che avviene istantaneamente. L’urto fra due particelle 
elementari, o l’emissione di un quanto da un atomo, possono essere considerati 
approssimazioni di questa astrazione. La meccanica quantistica stabilisce alcuni 
limiti dell’applicabilità di quest’astrazione che si vedranno più avanti; a dimen- 
sioni macroscopiche tali limitazioni possono ritenersi, fino a un certo grado, ines- 
senziali. | 

L’astrazione fisica corrispondente a un sistema locale di coordinate in M è 
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una certa convenzione sui principî della misura delle grandezze spaziali etempo- 
rali in una regione dell’ Universo, gli ordini delle quali possono variare tra limiti 
estesi da quello atomico e subatomico a quello di «tutto » l'Universo. È proprio 
la scelta di queste convenzioni, insieme con questi o quei principî d’invarianza 
delle leggi fisiche, che definisce le caratteristiche della geometria locale e globale 
dei diversi modelli dello spazio-tempo. 


Spazio-tempo classici. Nelle dimensioni macroscopiche del laboratorio le 
distanze possono essere misurate con righe rigide e strumenti simili, mentre il 
tempo può essere misurato mediante processi periodici di questo o quel genere, 
in particolare con gli orologi. È naturale ritenere l’indicazione dell ‘orologio co- 
stante per tutti i luoghi del laboratorio, trascurando la velocità finita nella tra- 
smissione dei segnali (della luce) del parte dell’orologio stesso, oppure calco- 
lando una correzione dovuta al ritardo nella lettura dell’orologio. Ciò conduce a 
un modello dello spazio-tempo del laboratorio della forma U x 7, dove U è un 
dominio dello spazio euclideo e 7 è un intervallo della retta dei tempi. Estrapo- 
lando questo modello «a tutto il mondo e per l’eternità» giungiamo al modello 
R? x R, che è dato da un’unica carta corrispondente a un dato sistema del labora- 
torio con le coordinate (x,, x9, x3, #). Se (x, x1, x, #9), i=1, 2, sono le 
coordinate di due punti dello spazio-tempo in questo sistema, risultano definiti 
gli intervalli che li separano, quello spaziale, 


V (PP x PP + (0 a DPF -xPP 


e quello temporale, # —#®. In un altro sistema di coordinate, fisso rispetto al 
primo, entrambi gl’intervalli fra i punti restano gli stessi (si suppone che le unità 
di misura delle lunghezze e del tempo siano le medesime). Perciò una qualsiasi 
altra carta di questo tipo si ottiene dalla prima mediante una traslazione dell’ori- 
gine e una rotazione rigida in R? (lo spazio) e una traslazione dell'origine in R 
(il tempo). La presenza di un moto rettilineo uniforme del secondo sistema del la- 
boratorio rispetto al primo conduce ad aggiungere alle coordinate in R° ancora 
una traslazione lineare nel tempo. Cosf sono definite le «carte galileiane» e le 
«trasformazioni galileiane delle coordinate» dello spazio-tempo classici. 


Spazio-tempo nella teoria della relatività ristretta. In questa teoria pure s'in- 
dividua e si definisce una classe di carte, ognuna delle quali viene data mediante 
l’astrazione fisica di «sistema inerziale di coordinate». Approssimativamente è 
inerziale ogni sistema di coordinate del laboratorio connesso con un punto sulla 
superficie terrestre; un’approssimazione ancora migliore è fornita dai sistemi di 
coordinate connessi con il Sole o con una «stella fissa». Due qualsiasi sistemi 
inerziali di coordinate si muovono, uno rispetto all’altro, di moto rettilineo uni- 
forme. Ogni sistema inerziale di coordinate identifica lo spazio-tempo con R° xR, 
e il passaggio da un sistema a un altro è dato da funzioni lineari; queste, però, nel 
caso di sistemi in moto tra loro, non conservano l’asse dei tempi. Pi precisamente, 
se f è il tempo in un sistema e ?' è il tempo in un altro sistema in moto rispetto al 
primo, una sezione «di tipo spaziale» t=#, dello spazio-tempo può non essere, 
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nell’altro sistema, rappresentata nella forma #=#j. Nella teoria della relatività 
ristretta si postula che la velocità c della luce sia la stessa in tutti i sistemi inerziali, 
cosi che hanno significato invariante i «coni-luce» x7+x3+x?—c?*=o. Le tra- 
sformazioni per passare da un sistema all’altro conservano l’intervallo «spazio- 
temporale» fra i punti di M: Ast=Ax?+Ax?+Ax?—c2At?, dove Ax,=x;—xl, 
At=t-t", (x, t) e (x’, #") sono punti di M in un qualsiasi sistema inerziale di 
coordinate. Queste condizioni definiscono le equazioni di transizione da un si- 
stema all’altro, che si chiamano trasformazioni di Lorentz. 

Lo spazio R‘ con la metrica definita da As? si chiama spazio di Minkowski. Gli 
spazi di Galileo e di Minkowski sono « piatti » nel senso della geometria differen- 
ziale. 


Spazio-tempo nella teoria generale della relatività. Tn questa classe di mo- 
delli lo spazio-tempo M è rappresentato da una varietà differenziabile a quattro 
dimensioni, ricoperta da carte locali e dotata di una metrica locale che solo in 
un’'approssimazione « infinitesimale » coincide localmente con la metrica di Min- 
kowski. La forma generale del quadrato della distanza tra punti vicini (x;) e 
(x;+dx;), î= 1... 4, è dato da una forma quadratica 


4 
fa dx; dxyy 


dove le g;; sono funzioni differenziabili delle coordinate locali e si chiamano 
«componenti del tensore metrico ». Localmente questa forma può essere ridotta 
alla forma y7+y3+y3—y?, ciò che riflette la coincidenza «in piccolo » con la me- 
trica di Minkowski. In termini di g;, sono definite le grandezze che caratterizzano 
la «curvatura » dello spazio-tempo, e per queste grandezze si scrivono le equazioni 
differenziali di Einstein, le quali legano questa curvatura con la densità e il ca- 
rattere del moto della materia-energia che si evolve nello spazio-tempo. La cur- 
vatura è localmente tanto maggiore quanto maggiore è la densità di materia- 
energia, il che spesso si esprime qualitativamente con l'affermazione: la gravita- 
zione incurva lo spazio-tempo. Questa curvatura si esprime nel fatto, per esempio, 
che l’area della sfera con raggio crescente e centro in un dato punto di M varia 
con una legge diversa da quella per lo spazio-tempo piatto. 

Nei modelli cosmologici di MM spesso si suppone che la materia e l'energia 
siano distribuite in M uniformemente e si muovano nello spazio isotropicamente; 
non vi sono direzioni privilegiate. Benché ciò contraddica i dati osservabili fino 
alle dimensioni galattiche, si presume che a dimensioni notevolmente maggiori 
la distribuzione discreta della materia, dopo una conveniente media, possa essere 
trascurata, di modo che in tali modelli globali venga a dominare l’aspetto continuo. 


Spazio delle fasi. Nello spazio-tempo M il moto di un punto materiale è 
dato dalla sua traiettoria, una curva in /M, che si chiama linea di universo del 
punto. Ad eccezione dei modelli cosmologici, che considerano M globalmente, 
oggetti della fisica sono i «sistemi isolati», cioè le regioni di M, e la materia in 
queste regioni, che si evolve in modo tale che l’influenza su di esse delle altre parti 
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di M possa essere, in un’approssimazione nota, trascurata. Spesso in questi casi 
un modello matematico del sistema è il suo spazio delle fasi N, unitamente alle 
curve o traiettorie su esso, che formano il quadro delle fasi del sistema. 

I punti dello spazio delle fasi N corrispondono a tutti i possibili stati istan- 
tanei del sistema. Le curve delle fasi su N corrispondono a tutti i possibili per- 
corsi dell'evoluzione del sistema. Molto spesso N è dotato in modo naturale di una 
struttura di varietà differenziabile e le curve delle fasi sono soluzioni di equazioni 
differenziali. 

Per esempio, si supponga che in un dominio U dello spazio galileiano possano 
muoversi £ punti materiali sotto l'influenza delle forze di mutua interazione (ad 
esempio gravitazionale) e, eventualmente, per effetto di altre forze (per esempio, 
di un campo di forze esterno). In accordo con i principî della meccanica di New- 
ton l’evoluzione di questo sistema è definita dalle posizioni iniziali e dalle velocità 
iniziali dei punti, cioè in tutto da 64 numeri (3 coordinate cartesiane e 3 compo- 
nenti del vettore velocità per ogni punto). Lo spazio delle fasi N di questo si- 
stema sarà una varietà a 6k dimensioni U* (posizioni) x R** (velocità), il secondo 
fattore essendo il fibrato tangente a U* (cfr. ancora l’articolo «Applicazioni »). 
Lungo ogni curva delle fasi sono soddisfatte equazioni differenziali del tipo 
dg [dt =p9, dp [dt= F(p, g, 1), dove le gf?) sono le coordinate del punto i-esi- 
mo; le pf? sono le componenti della sua velocità, f = (p{?), = (g?)); # è il tenipo. 
La funzione F è, insieme con lo spazio delle fasi, la caratteristica matematica fon- 
damentale del sistema. 

Un'analisi dettagliata permette d’individuare una classe molto importante 
di sistemi, nei quali gli spazi delle fasi e le equazioni del moto hanno una strut- 
tura speciale: i cosiddetti sistemi hamiltoniani. 

Sia N lo spazio delle fasi di un certo sistema e si chiamino osservabili (macro- 
scopiche) del sistema le funzioni differenziabili su N. Le osservabili corrispon- 
dono alle diverse grandezze fisiche che possono essere misurate in tutti i possi- 
bili stati del sistema. 

Il sistema si dice hamiltoniano se sono soddisfatte le seguenti condizioni: 

1) Sull’insieme delle osservabili è data una legge binaria di composizione 
F, G-{F, G} (cfr. l'articolo « Applicazioni») che si chiama parentesi di Pois- 
son e definisce sulle osservabili la struttura di algebra di Lie. Con ciò, per o- 
gni punto x€ N esistono le osservabili 9, ..., 4, («coordinate generalizzate») e 
Py + Pr («impulsi generalizzati») tali che in un intorno del punto x esse sono 
le coordinate locali e, in questo intorno, la parentesi di Poisson è data dall’u- 
guaglianza 


r,{dF dG. dG dF 
F,G}= 
{ } pi (5 dgi Òb; So) 


Tali coordinate (9, #) si chiamano canoniche; esse non sono definite univoca- 
mente. 

11) È data un’osservabile 77, la hamiltoniana del sistema, o l’energia osser- 
vabile, tale che su ogni traiettoria, che si evolva nel tempo, ogni osservabile F sod- 
disfa l'equazione differenziale dF/dt={H, F}. 
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Le coordinate canoniche (9, p) localmente formano un sistema completo di 
osservabili, attraverso le quali si esprimono tutte le altre. Perciò la condizione 
I) è equivalente al sistema di equazioni differenziali di Hamilton 

dp, __dH dg, dH 
Assegnando /7 e la posizione iniziale del sistema e risolvendo questo sistema di 
equazioni, si ottiene una traiettoria concreta del sistema che descrive la sua evo- 
luzione. 

Si consideri, per esempio, un sistema di £ punti materiali che si attraggono 
secondo la legge di Newton. Il suo spazio delle fasi R**(coordinate) x R°*(im- 
pulsi) è il supporto del sistema hamiltoniano. Nello spazio vi è il sistema cano- 
nico globale di coordinate: g{9) =coordinate cartesiane dei punti (j=1,2, 3; 
î=1,..., &); p= componenti degli impulsi m; (dg /dt) sugli assi corrispon- 
denti (71; sono le masse). La hamiltoniana ha la forma 


b 


vile 

12M Fr Vij 
dove r;; è la distanza tra i-esimo e j-esimo punto, pf = I° + pf?" +pi9°°. Si osservi 
che qui la hamiltoniana ha delle singolarità per r;;=0 («urti»). 
i Le equazioni differenziali descrivono l'evoluzione anche di molti altri sistemi 
in un’enorme classe di modelli, da quelli fisici a quelli ecologici. In queste de- 
scrizioni a priori domina l’aspetto continuo. Si mostrerà ora attraverso alcune ti- 
piche nozioni come appaiano le caratteristiche discrete. Esse si riferiscono ai tipi 
di evoluzione del sistema ed è comodo descriverle in termini del suo quadro delle 
fasi, cioè della disposizione delle traiettorie nello spazio delle fasi. L’«individuali- 
tà» di ogni storia concreta del sistema è descritta in primo luogo dalle caratteri- 
stiche topologiche discrete nel continuo di tutte le traiettorie. 


Stati di equilibrio. Sono punti dello spazio delle fasi nei quali le velocità sono 
nulle. Da un tale stato iniziale il sistema non esce in alcun modo. Nel caso ha- 
miltoniano si tratta dei punti dove d/7/dp;= dH/dqg;= 0. 

Il caso più generale è dato dalle varietà invarianti nello spazio delle fasi, cioè 
quelle varietà tali che, se il punto vi capita nel momento iniziale, resta eterna- 
mente in esse. Sono varietà invarianti le linee di livello degl’integrali del sistema, 
cioè le osservabili i cui valori non cambiano nel corso dell’evoluzione. L'esempio 
più importante d’integrale di un sistema hamiltoniano conservativo è la sua ener- 
gia, cioè la hamiltoniana H. 

. Un sistema con uno spazio delle fasi a 21 dimensioni si dice completamente 
integrabile se si può fibrare in varietà invarianti a n dimensioni, su ognuria delle 
quali il moto proceda, in convenienti coordinate locali, linearmente. Quando il si- 
stema è hamiltoniano e queste varietà sono compatte, esse sono dei tori a n di- 
mensioni e su esse il moto è quasi periodico: in adeguate coordinate angolari, 
Py» +» Pn) definite mod 27, il moto è descritto dalle equazioni 9; (#)—@;(0) = %;#, 
dove le ©; sono le frequenze del moto sul toro; ;(0) sono i valori iniziali delle 


Continuo/discreto 950 


coordinate. Solitamente tali tori sono individuati dalle equazioni I, = cost, ..., 
I,== cost, dove gli /;sono integrali speciali del sistema, detti anche azioni variabili. 
Il moto su ogni toro può essere immaginato come un insieme di 7 oscillatori che 
oscillano concordemente con le frequenze w;. 


Stabilità e attrattori. Non tutti gli stati di equilibrio descrivono la storia 
reale del sistema. Le condizioni iniziali di qualsiasi sistema sono note solo appros- 
simativamente e può accadere che tutte le traiettorie che cominciano vicino allo 
stato di equilibrio si allontanino da esso (esempio: un pendolo costituito da una 
sbarra rigida nella posizione superiore). Tale stato di equilibrio si dice instabile. 
AI contrario, se condizioni iniziali vicine allo stato di equilibrio dànno traietto- 
rie che restano vicine a quella di equilibrio, tale stato è stabile (con significati di- 
versi, a seconda della scelta della definizione matematica). Analogamente, le va- 
rietà invarianti possono essere stabili o instabili. Per esempio, sul piano delle fasi 
può esservi una traiettoria chiusa senza intersezioni. Le traiettorie vicine ad essa 
possono avvolgervisi attorno da entrambi i lati (ciclo limite stabile), o da un lato 
solo (ciclo limite semistabile), oppure svolgersi da entrambi i lati (instabilità). 
Esse possono comportarsi anche in altri modi; per esempio, un anello attorno 
alla traiettoria chiusa può essere riempito da traiettorie chiuse parallele. Gli in- 
siemi, del tipo ciclo limite stabile, verso i quali si avvicinano tutte le traiettorie 
che comincino vicino ad essi, si chiamano attrattori. Ogni attrattore ha il suo do- 
minio di attrazione. Questi dominî sono divisi dalle varietà separatrici. La confi- 
gurazione degli attrattori e delle varietà separatrici, quando esistono, sono carat- 
teristiche discrete essenziali del sistema: esse definiscono i regimi limite e il loro 
andamento. Molti sistemi elettrici e meccanici, in particolare generatori di oscil- 
lazioni, sono costruiti in modo tale che nell’intorno del loro regime caratteristico 
di funzionamento esistano questi regimi limite. 

Una classe importante di effetti discreti è legata alla possibilità che il sistema 
abbia delle instabilità che si esprimano bruscamente, il cui tipo di comporta- 
mento, a lungo andare, in generale può dipendere in modo discreto dai dati ini- 
ziali. 

Per esempio, l’esistenza del sistema solare come un tutt’unico significa che il 
Sole e i pianeti si trovano in uno «stato legato»: le loro mutue distanze sono li- 
mitate. È stabile questo stato? Cioè, non potrebbe accadere che un pianeta sia 
«espulso» e se ne vada verso l'infinito? 

Il calcolo approssimato del moto di un pianeta con i metodi della teoria delle 
perturbazioni implica l’uso delle serie. Nei denominatori dei loro coefficienti 
figurano combinazioni lineari della forma k,01+...+k,6,, dove i &j sono nu- 
meri interi e le +; sono le frequenze di rivoluzione. Il meccanismo che conduce a 
questo risultato qualitativamente può essere chiarito cosi: in una prima appros- 
simazione il moto di ciascun pianeta può essere calcolato supponendo che gli altri 


pianeti siano diffusi uniformemente lungo le rispettive orbite, di modo che il cam- . 


po gravitazionale da essi prodotto resti invariato. Però questa approssimazione si 
scosta tanto più fortemente dalla realtà quanto più spesso i pianeti, nel loro moto, 
si raccolgono in gruppi che si trovino su uno stesso raggio. Se le frequenze di ri- 
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voluzione sono linearmente dipendenti, cioè, se klw, +... +k9%0,=0, una tale po- 
sizione si ripete infinite volte. Se una tale combinazione lineare con 4? non grandi, 
pur non essendo uguale a zero, risulta molto piccola, s'introdurrà lo stesso una 
notevole perturbazione. Per esempio, Giove e Saturno in un giorno percorrono 
circa 299’ e 120,5” rispettivamente, cosî che il denominatore 2wg— 5%g è molto 
piccolo. Ciò produce una grande perturbazione dei pianeti con un periodo di circa 
ottocento anni. L’accumulazione di tali perturbazioni in un sistema tipo quello 
planetario può condurre alla sua disintegrazione. Pertanto, in questa idealizza- 
zione, la storia di un sistema meccanico può dipendere essenzialmente da pro- 
prietà aritmetiche dello stato iniziale, quali la commensurabilità delle frequenze 
di rivoluzione iniziali. Un’esatta indagine matematica delle traiettorie di fase di 
tali sistemi permette di chiarire la struttura straordinariamente complessa del loro 
quadro delle fasi (teoria di Kolmogorov-Arnol'd-Moser). Per esempio, se la 
hamiltoniana del sistema si discosta poco dalla hamiltoniana di un sistema inte- 
grabile («perturbazione debole»), si verifica che, sotto certe condizioni, vi è un 
insieme di tori invarianti del sistema non perturbato, avente misura di Lebesgue 
grande, che non sparisce, e che solo alcuni tori si deformano e il moto su questi 
resta condizionatamente periodico. T'uttavia, per n>2, le traiettorie che non ca- 
pitano su tori deformati possono vagare tra i loro interstizi, che hanno struttura 
complessa, e allontanarsi quanto si vuole dallo stato iniziale. 

Un andamento ancor più caotico si rivela nei tipi di moto lungo traiettorie 
geodetiche su varietà con curvatura negativa. In questi problemi le questioni 
sulle traiettorie individuali perdono quasi completamente di significato e il modo 
naturale di porre i problemi è in una certa misura «complementare»: si svolgono 
indagini sulle caratteristiche continue del moto che si ottengono mediando le 
traiettorie sullo spazio delle fasi e sul tempo. È, questo, l’oggetto della mecca- 
nica statistica (cfr. oltre). 


Controllo e catastrofi. Un aspetto importante del comportamento «discre- 
to » di un sistema continuo, che risale ai lavori di Poincaré, è stato sottolineato e 
studiato a fondo da Thom [1971] e dalla sua scuola e ha preso il nome di «teoria 
delle catastrofi ». Nella teoria delle catastrofi si considera una famiglia di sistemi 
dipendenti da alcuni «parametri di controllo ». Sia ce C un punto nello spazio dei 
parametri di controllo, N, sia il corrispondente spazio delle fasi. Variando c, la 
configurazione degli attrattori e delle varietà separatrici del quadro delle fasi di 
N, può cambiare; per esempio, possono sparire e/o apparire stati di equilibrio; 
stati di equilibrio stabili possono diventare instabili, ecc. Nello stesso tempo la 
variazione del quadro delle fasi conserva il suo tipo topologico fino a quando c 
non interseca alcuni punti critici nello spazio dei parametri di controllo C e in 
questi punti la variazione avviene con un salto. Si supponga ora che il sistema con- 
trollato si sia evoluto lungo traiettorie vicine a un attrattore stabile A, e che i pa- 
rametri di controllo c siano variati lentamente e, raggiungendo il valore c,, l’at- 
trattore A, scompaia, o diventi instabile. Allora il sistema, di regola, cambia re- 
pentinamente il tipo di comportamento per portarsi su un altro regime limite. 

Si consideri, per esempio, la seguente illustrazione meccanica. Il sistema con- 
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trollabile sia una sfera che rotola lungo una curva piana (una scanalatura) sotto 
l’azione della forza di gravità. I minimi locali di questa curva sono stati di equili- 
brio stabili; per semplicità si riterrà che l’attrito sia cosi grande che da ogni po- 
sizione la sfera rotoli verso il minimo pit vicino e qui essa si arresti senza ulteriori 
oscillazioni. Si supponga poi che i parametri di controllo cambino la forma della 
curva. AI momento iniziale la sfera si trovi in un certo minimo; sulla curva si 
formi poi un altro minimo contiguo al precedente, ma più basso, e quindi la bar- 
riera tra i due minimi cominci ad abbassarsi. Quando questa giunge al livello del 
primo minimo, quest’ultimo diventa instabile e in un istante successivo la sfera 
rotola nel nuovo minimo. 

‘Tali passaggi di un sistema da un regime di comportamento a un altro, sotto 
forma di salti in seguito a una variazione lenta di alcuni parametri, sono stati stu- 
diati da Thom in varie situazioni biologiche e sociali. 


Meccanica statistica dell’equilibrio. Si consideri un volume macroscopico, 
per esempio una mole di gas a una data temperatura. Se è sufficientemente rare- 
fatto, il suo comportamento può essere modellato riguardando le molecole quali 
particelle classiche in moto secondo le leggi della meccanica di Newton e intera- 
genti tra loro mediante un certo potenziale di repulsione. Poiché una mole di gas 
contiene circa 6 - 10°* molecole, lo spazio delle fasi del corrispondente sistema mec- 
canico ha una dimensione enorme. L’energia E è un integrale del moto, ma l’iper- 
piano £ = cost ha una dimensione inferiore solo di uno. Le curve delle fasi su di 
esso formano un flusso che conserva la misura di Liouville dp,...dp3:dg1...d43; 
(si veda l’articolo «Applicazioni» di questa stessa Enciclopedia). Il comporta- 
mento individuale delle curve delle fasi è eccezionalmente complesso e non è 
possibile indagarlo. Tuttavia nello studio macroscopico degli stati di equilibrio 
ci si interessa a un piccolo numero di osservabili quali la pressione, la densità, ed 
esse mostrano un comportamento di una regolarità e semplicità sorprendenti. 
Secondo Maxwell, Boltzmann e Gibbs ciò è dovuto al fatto che queste variabili 
macroscopiche si ottengono mediando le caratteristiche microscopiche e il risul- 
tato teorico di questa media, pur non coincidendo necessariamente con l’osserva- 
bile, è vicino ad esso con una probabilità quasi uguale all’unità. 

Si esamineranno più da vicino le procedure di mediazione qui essenziali. 
Sia funa funzione su N. Il valore di questa funzione in ogni punto - stato del si- 
stema — è il valore di una certa osservabile macroscopica. Si consideri un’evolu- 
zione del sistema e sia x(#)e N il punto corrispondente dello spazio delle fasi 
all’istante f. L'esperienza mostra che il valore di f(x(t)) ha un limite. Esso può 
essere espresso nel modo seguente: 


T 

im 7 | feMa=ja) 
T++9 li) 

dove x=x(0). La funzione f è una media temporale lungo una data traiettoria 

ed essa ha un immediato significato fisico. Però calcolarla è difficile data la com- 

plessità del comportamento individuale di una traiettoria. Si prestano al calcolo, 

invece, alcune medie spaziali, cioè degl’integrali estesi allo spazio delle fasi (più 
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precisamente, estesi a E£= H=cost) con la misura di Liouville. Il teorema di 
Birkhoff afferma che, se sono soddisfatte alcune condizioni di ergodicità, le medie 
temporali esistono e coincidono con le medie spaziali tranne che per un insieme 
di condizioni iniziali di misura nulla. La causa intuitiva di ciò sta nel fatto che 
quasi tutte le traiettorie individuali, dopo un lungo tempo, capitano nell’intorno 
di ogni punto dello spazio delle fasi e vi si attorcigliano attorno con una densità 
proporzionale alla misura di Liouville. 


Meccanica statistica del non-equilibrio. 1 suoi modelli hanno a che fare con 
processi quali il comportamento di un certo volume di gas, precedentemente sud- 
diviso in due metà a pressione e temperatura diverse, dopo aver tolto la parete 
divisoria, oppure la condensazione di un gas in un liquido, o il raffreddamen- 
to di un liquido in un solido per abbassamento della temperatura, cioè transizioni 
di fase. 

Nei problemi del primo tipo sorge il problema del passaggio dalle equazioni 
hamiltoniane del moto delle molecole alle equazioni mediate dell’idrodinamica, 
che descrivono il campo delle velocità, i processi di trasporto del calore, ecc. Que- 
ste equazioni differenziali non lineari alle derivate parziali corrispondono a effetti 
«discreti» quali le onde d’urto. 

Nei problemi del secondo tipo sorge il problema di trovare i valori critici di 
quelle grandezze macroscopiche per i quali avvengono salti nella densità, nella 
capacità termica, ecc., e appare la struttura «granulare » del mezzo, cioè la fron- 
tiera tra le fasi. 

Una delle difficoltà di principio della fisica statistica è capire in qual modo la 
reversibilità del tempo nelle equazioni del moto delle particelle si accordi con 
la sua irreversibilità nel comportamento macroscopico del mezzo. Quest'ultima si 
riflette nel fatto che il calore passa dalle regioni con temperatura più alta alle re- 
gioni con temperatura pit bassa e non viceversa; la viscosità rallenta il flusso dei 
liquidi e dei gas e cosî via. Una spiegazione qualitativa di questi effetti di nuovo 
consiste nel fatto che queste leggi macroscopiche sono soddisfatte solo con una 
grande probabilità. Tuttavia le difficoltà del calcolo sono molto grandi e una teo- 
ria conseguente della meccanica statistica del non-equilibrio fino ad ora non 
esiste. 


Onde. Nella teoria macroscopica dei mezzi continui hanno una importanza 
eccezionale i fenomeni ondulatori. I loro modelli matematici — con una nuova in- 
terpretazione — hanno parimenti un’importanza fondamentale nella meccanica 
quantistica. 

Il più semplice fenomeno ondulatorio è dato dalle oscillazioni armoniche di 
una certa grandezza con frequenza +. La dipendenza di questa grandezza dal 
tempo è della forma Aef@4, dove © è un numero reale. Il loro periodo è uguale a 
2rt/®, cosicché @ è la frequenza circolare delle oscillazioni. (Se la grandezza è 
reale, si può scrivere A cosow(#—f,), ma le notazioni complesse sono comode 
matematicamente, e nella meccanica quantistica gli oggetti fondamentali oscil- 
lanti — le funzioni di stato ) — in generale sono complesse). Per esempio, oscilla 
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in questo modo lo spostamento di un punto materiale su una molla finché la 
forza elastica della molla è soggetta alla legge di Hooke, cioè è proporzionale al- 
l'allungamento della molla. In questo modo oscilla l'intensità della corrente nel 
più semplice circuito oscillante. Le oscillazioni di qualsiasi forma con frequenza 
©, che si ripetono cioè rigorosamente dopo 27 /w unità di tempo, possono essere 
rappresentate da una serie di Fourier 


toe » 
3A A,eo!, 
n= 

cioè le si può ottenere mediante una sovrapposizione di oscillazioni lineari. Se al 
posto della serie di Fourier si scrive l’integrale di Fourier F(t)={tYA(0)e040, 
dove 4(w) è una funzione delle frequenze, si possono ottenere diverse leggi di 
variazione di una grandezza rispetto al tempo, espresse sotto forma di sovrappo- 
sizione di oscillazioni armoniche, dove però lo spettro di frequenze è ora conti- 
nuo. Tra queste leggi vi sono quelle rappresentate da « picchi» della grandezza 
F(t) arbitrariamente grandi e stretti per esempio all’istante #=0 e con valori 
vicini a zero in tutti gli altri istanti, e ciò a causa dell’interferenza fra le onde. 

Se la grandezza ha carattere di campo, cioè dipende anche, per esempio, 
da una coordinata spaziale x, è possibile considerare l’onda armonica Ae'#7+@0, 
Qui & è il numero d’onda: 27/4 è il periodo spaziale dell'onda, mentre 2r/w è 
quello temporale. Muovendosi lungo l’asse x con velocità —w/k, cioè passando 
al sistema di coordinate x'=x+ (#/&)t, si ottiene l’onda Ae'*" indipendente dal 
tempo; in altre parole, l’onda armonica considerata si muove uniformemente 
nello spazio con velocità — w/R senza cambiare la sua forma. Nei mezzi lineari le 
onde armoniche si muovono tutte con una stessa velocità v e un moto ondulato- 
rio generico si ottiene quale sovrapposizione di queste onde armoniche con & 
diversi, con ©=và e con le ampiezze A(k). Un’opportuna sovrapposizione 
F(x, t)=[t®A(kR)e'&-v0 dk si può rappresentare come un picco stretto vicino 
al punto x = vt che scende rapidamente a zero. Esso si muove con velocità v come 
un tutt’unico. Queste formazioni si chiamano « pacchetti d’onda ». Per molti versi 
essi sono simili a «particelle discrete» e si ottengono quale risultato dell’interfe- 
renza fra «onde continue ». Si osservi che si può ottenere un pacchetto d’onda ben 
localizzato nello spazio-tempo solo quale somma di onde con numeri d’onda, 0 
frequenze, fortemente diffusi. Inversamente un’onda con valori puntuali di £, ® 
è «diffusa» nello spazio-tempo. Un’esatta formulazione di queste relazioni è il 
fondamento del principio d’indeterminazione di Heisenberg in meccanica quan- 
tistica, dove esse vengono applicate alla funzione d’onda y. 

In certi mezzi possono pure propagarsi onde armoniche, ma con altre rela- 
zioni fra il numero d’onda È e la frequenza ©; in particolare, le velocità di queste 
onde possono essere diverse. Inoltre, nei mezzi non-lineari, in generale, non si può 
realizzare la somma di due perturbazioni che si propagano. Ciò nonostante sono 
noti mezzi non-lineari assai interessanti, nei quali possono diffondersi perturba- 
zioni ondulatorie localizzate, che si comportano come un tutt’unico e che asin- 
toticamente conservano la propria forma perfino dopo urti e interazioni. Tali 
formazioni si chiamano onde isolate o «solitoni». I loro primi esempi furono 
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scoperti da Boussinesq, Korteweg e De Vries indagando la propagazione di onde 
lunghe sulla superficie di acque non profonde in una certa approssimazione non- 
lineare. In questi ultimi anni sono state scoperte moltissime equazioni d’onda 
non-lineari aventi tali soluzioni solitoniche e multisolitoniche. Vi è la speranza 
di scoprire equazioni d’onda realistiche della meccanica quantistica, dove tali 
soluzioni descrivano particelle elementari. 

Si torni ora al caso di un «oscillatore armonico», cioè di una grandezza che 
oscilla nel tempo come Ae'©0. Questo processo corrisponde a oscillazioni «li- 
bere» e avviene senza scambio di energia con l’esterno. Si supponga ora che su 
tale grandezza agisca una perturbazione esterna periodica con frequenza @. Per 
esempio, una sferetta su una molla fatta oscillare con una forza esterna. Allora 
l’ampiezza di tali oscillazioni forzate, a mano a mano che & si approssima a %wy, 
crescerà (in un modello idealizzato fino a ©); cioè si verificherà una risonanza. 
Corrispondentemente, il grafico della quantità d’energia che l’oscillatore, in que- 
ste condizioni, è in grado di assorbire, in dipendenza della frequenza © della per- 
turbazione esterna, ha un picco nel punto © = ©. Pertanto le risonanze possono 
essere riguardate quali fenomeni di tipo discreto nello spazio frequenze-energie. 


Campo elettromagnetico. Le cariche elettriche connesse con la materia nello 
spazio-tempo generano in esso un campo elettromagnetico. Nei modelli della 
teoria della relatività ristretta, fissato un sistema inerziale di coordinate, tale 
campo è dato da due vettori spaziali, E e H, definiti in ogni punto dello spazio- 
tempo. Il vettore E — intensità del campo elettrico — definisce la forza che agisce 
sulla carica elettrica unitaria in quiète in quel punto. Il vettore H — intensità del 
campo magnetico — definisce la componente della forza che agisce sull’unità 
elettrica in moto, e questa componente è proporzionale alla velocità del moto e 
perpendicolare ad essa. I vettori E ed H dipendono dai punti dello spazio-tempo, 
sono differenziabili e soddisfano un sistema di equazioni differenziali alle derivate 
parziali: le equazioni di Maxwell. La densità dell’energia trasportata dal campo è 
proporzionale al quadrato dell’ampiezza, cioè a E*+H?, 

Anche in questa teoria, pertanto, domina l’aspetto continuo. Il discreto appare 
solo nella descrizione del moto delle stesse cariche elettriche che generano il cam- 
po e che interagiscono con esso e fra loro. T'uttavia nell’elettrodinamica classica 
non vi è posto per i fotoni e non è possibile dare una spiegazione ai fenomeni nei 
quali le proprietà quantistiche della radiazione elettromagnetica svolgono un 
ruolo essenziale. 

Infatti, nell’ambito della teoria classica, un’onda elettromagnetica con fre- 
quenza &, che si propaga da una sorgente puntiforme, è a simmetria sferica; la 
densità di energia da essa trasportata diventa arbitrariamente piccola allontanan- 
dosi dalla sorgente e non sono possibili sue improvvise concentrazioni di quanti 
hw/2r in fenomeni quali, per esempio, gli effetti fotoelettrici. 

Nella teoria classica un aspetto discreto interviene dall'esterno, considerando 
il campo e le cariche che lo producono separatamente. Una carica puntiforme e 
produce attorno a sé un campo elettrico statico con un’intensità e/r? alla distanza 
r dalla carica stessa. Pertanto essa si presenta quale singolarità del campo, cioè 
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come punto nel quale il campo diventa infinito (cfr. l'articolo « Applicazioni» di 
questa stessa Enciclopedia). 

Rappresentazioni analoghe sono usate nella teoria del movimento della ma- 
teria nell’ambito della teoria generale della relatività, dove gli addensamenti di 
materia si possono riguardare quali singolarità del campo gravitazionale e le leggi 
del moto possono dedursi dalle equazioni del campo. 


1.3. Modelli teorici della microfisica. 


Lo spazio-tempo nei modelli fondamentali della microfisica è un certo domi- 
nio nello spazio-tempo galileiano (teoria non-relativistica), oppure nello spazio- 
tempo di Minkowski (teoria relativistica). La teoria non-relativistica ha a che 
fare con un’approssimazione, nella quale il moto avviene con una velocità piccola 
rispetto a quella della luce e perciò questa viene ritenuta infinita. L'ordine di que- 
sta piccolezza definisce il carattere dell’approssimazione. Per esempio, nel modello 
semiclassico dell’atomo d’idrogeno la velocità media dell'elettrone è circa uguale 
a c/137, ciò che giustifica l’approssimazione non-relativistica. Le velocità sono 
legate ai processi energetici. Perciò i processi ad alte energie devono essere stu- 
diati nella teoria relativistica cosi come gli «effetti fini » quali, per esempio, la se- 
parazione delle linee spettrali in processi energetici relativamente deboli. 

Sovente gli spazi delle fasi di sistemi isolati appaiono nei modelli della mec- 
canica quantistica come oggetti intermedi dell’indagine; inizialmente il sistema 
viene descritto mediante il suo spazio delle fasi classico con le relative osservabili; 
dopo di che vi si applicano speciali «regole di quantizzazione ». Si descriveranno 
ora nei particolari alcuni esempi. 

Nella meccanica quantistica, cosî come in quella classica, inizialmente si de- 
scrive la situazione in termini di osservabili e di stati, tuttavia le une e gli altri 
corrispondono a oggetti matematici di natura diversa. | 

Gli stati (o stati puri) di un sistema meccanico-quantistico sono raggi, 0 spazi 
a una dimensione in un certo spazio di Hilbert I, che è uno spazio lineare sul 
corpo dei numeri complessi C, nel quale è dato un prodotto scalare ( f, g) con le 
proprietà (af, g)=a(f, £) e (f.£)=(&, f) (d è il numero complesso coniugato 
di a). Posto If {=(f,f)Y?, si chiede che da || f||=0 segua che f=0. Questa 
norma definisce su IC una topologia e lo spazio I. dev'essere completo in que- 
sta topologia, cioè ogni successione {f,} con || f.,—fn||*0 per min(7,m)> co 
converge a un certo elemento di I 

Gli spazi tipici I che appaiono nella meccanica quantistica contengono tutte 
le funzioni differenziabili f su una certa varietà N con misura p, per le quali 
Sw|f]}du<%, e cosî pure tutte le «funzioni» limite rispetto al prodotto scalare 
(S£)=Jwf8 du. Questi spazi si indicano con Ly(N). 

In particolare, se un sistema classico hamiltoniano è descritto mediante le 
coordinate canoniche globali 91, ..., 9a) Py) +» Pao le funzioni d’onda o di stato 
Y(4;, -..,4,) con |b|}=f|W]? d9,...dg, appartengono allo spazio di Hilbert cor- 
rispondente a questo sistema e descrivono stati possibili del sistema nella teoria 
quantistica. 
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Assegnare lo stato quantistico di un sistema mediante la funzione y in questa 
rappresentazione delle «coordinate» permette di ottenere su esso l’informazio- 
ne seguente: la probabilità che, in un esperimento per misurare le coordina- 
te generalizzate 41, ..., gn, i loro valori giacciano in un dominio U è uguale a 
Soldi? da1...dan/IbÌ. 

Pertanto in prima approssimazione la descrizione quantistica degli stati di 
un sistema introduce un nuovo aspetto della continuità (è la funzione di stato 0 
d’onda + «diffusa» invece dei punti nello spazio delle coordinate-impulsi) e una 
probabilità che non figura nella descrizione classica. Una particella ben loca- 
lizzata corrisponde a un «pacchetto d’onda» di funzioni ù. 

Passando ora alle osservabili, si rileva come in meccanica quantistica a ogni 
osservabile corrisponda un operatore lineare A che agisce sullo spazio degli stati 
JC del sistema. 

Alle osservabili a valori reali corrispondono operatori autoaggiunti, per i 
quali (A4f, g)=(f, Ag) per tutti gli f, ge XL. Se fe I è tale che Af=Xf per un 
certo numero }, allora questo numero si chiama autovalore di A e f si dice auto- 
vettore corrispondente a questo autovalore. Gli autovalori di un operatore au- 
toaggiunto A sono sempre reali; essi formano una parte dello spettro dell’operato- 
re A, che, per definizione, è formato da quei X per i quali A—X/ non è invertibile 
(I è l'operatore identità). Nel caso in cui A è autoaggiunto e soddisfa la condi- 
zione supplementare di completa continuità, il suo spettro è costituito esatta- 
mente dai suoi autovalori che sono numerabili, mentre con gli autovettori di A 
si può formare una base ortonormale dello spazio XY. Si osservi che a uno stesso 
autovalore ) può corrispondere un intero spazio vettoriale di autovettori ; in fisica 
la sua dimensione si chiama grado di degenerazione di X. Nel caso generale nello 
spettro di A, oltre la componente discreta, vi può essere una componente con- 
tinua. 

Sia A una certa osservabile di un sistema quantistico con spazio degli sta- 
ti IC. Sia pe X un vettore di stato del sistema. Si supponga per semplicità 
che $,, ..., Yn, -.. sia una base ortonormale in IC, cioè |W;|=1, (Wi J;j)=o0, 
Av;=2;d;, e si scomponga in questa base: 


È <Z ai. 


Allora, misurando l’osservabile A nello stato ù, si possono ottenere solo i valori 
A; e ogni valore A, può essere ottenuto con la probabilità |a;|?/{W]?. 

Questo è il modello matematico fondamentale mediante il quale appaiono le 
caratteristiche quantistiche discrete del sistema a partire dai metodi continui 
della sua descrizione. In presenza di una componente continua dello spettro i va- 
lori di un’osservabile in uno stato sono pure distribuiti in modo continuo con una 
certa densità di probabilità, ma qui una esatta descrizione del risultato è matema- 
ticamente più complessa e non ci si soffermerà. 

Le osservabili quantistiche possono essere di tipo classico e non-classico. 
Delle prime fanno parte l’energia, le coordinate generalizzate e gl’impulsi. Delle 
seconde fanno parte lo spin e cosf pure gli altri diversi numeri quantici. 
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Le regole fondamentali per ottenere le osservabili quantistiche di tipo clas- 
sico sono le seguenti. Se gi, .., 9,3 Py» ++» fn sono le osservabili classiche delle 
coordinate generalizzate e degl’impulsi di un sistema hamiltoniano e gli elementi 
di %C si considerano nella rappresentazione delle coordinate (4, .--, 9), allora 
l’operatore della coordinata g; è la moltiplicazione per g;, mentre l’operatore del- 
l'impulso p;è —ih(d/dg;), dove 4 è la costante di Planck. Se la hamiltoniana del si- 
stema classico ha la forma V(g)+T(£) (come in un sistema di particelle con 
interazioni gravitazionali, o elettromagnetiche), il suo corrispondente operatore 
dell'energia 77 si ottiene sotto forma di somma dell’operatore di moltiplicazione 
per V(q) e dell’operatore differenziale T(—i4(òd/dg;)). L'operatore dell'energia 
si chiama anche «operatore di Schròdinger» del sistema. 

L’evoluzione del sistema può essere descritta in due modi: o quale evoluzione 
del suo vettore di stato in I con le osservabili costanti (rappresentazione di 
Schrédinger), oppure quale evoluzione degli operatori delle osservabili con il vet- 
tore di stato costante (rappresentazione di Heisenberg). Formalmente la seconda 
descrizione è completamente analoga-a quella hamiltoniana: l’evoluzione dell’os- 
servabile A soddisfa l’equazione differenziale 

dA_ H H, al 

dt h 
dove al posto della parentesi di Poisson appare l’operazione di commutazione 
[A, B]= AB—BA, che introduce nell’insieme delle osservabili quantistiche la 
struttura di algebra di Lie. Nella prima descrizione si ottiene equazione di 
Schrodinger #h(dy/dt)= Hb. 

Da un punto di vista matematico si può dire che il passaggio dalle osservabili 
classiche d’un sistema hamiltoniano a quelle quantistiche consiste nella scelta 
della rappresentazione dell’algebra di Lie-Poisson delle osservabili classiche nel- 
l’algebra di Lie degli operatori autoaggiunti d’uno spazio di Hilbert. Questa 
rappresentazione conserva l’equazione dell’evoluzione (nelle forme di Hamilton 
e di Heisenberg). 

Qui di seguito si dà una breve descrizione di come si usino questi concetti 
generali per spiegare fenomeni concreti del micromondo. 


Livelli di energia. Lo stato non-relativistico dell'atomo d’idrogeno, in un 
sistema di coordinate rigidamente connesso con il nucleo e ove non si tenga conto 
dello spin dell’elettrone, è dato da una funzione w nello spazio fisico euclideo R? 
con f|y|®< co. L’operatore dell’energia H ha la forma 


he (dv db dd ed 
Hy=-5 = FOMESTIET] Sane 
nm \ dx )y Pd Va +y +% 
dove e è la carica dell'elettrone e m è la sua massa. Uno studio analitico mostra che 
questo operatore è dotato di una successione discreta numerabile di autovalori, i 
quali per l’appunto corrispondono ai livelli di energia dell'atomo d’idrogeno, ri- 


costruiti a partire dai dati delle misure spettroscopiche, che forniscono le diffe- 
renze di questi livelli di energia. In questo e in casi analoghi una spiegazione qua- 
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litativa dello spettro discreto è la seguente. L’attrazione dell’elettrone verso il 
nucleo è descritta dal potenziale —e/r. Si consideri un modello grossolano, nel 
quale il potenziale abbia la forma di una buca con le pareti molto alte. Allora la 
funzione w, che descrive lo stato dell’elettrone in questa buca, deve annullarsi 
fuori delle pareti e, per continuità, anche sulle pareti. La si decomponga in onde 
spaziali armoniche. Allora, di ogni componente, internamente alla buca di po- 
tenziale, vi dev'essere un numero intero di semionde. Ma l’energia di un’onda ar- 
monica è proporzionale al quadrato di questo numero e ha un va; >: e definito solo 
nel caso armonico. Ciò spiega come in questo modello si abbia uno spettro discre- 
to. Nel caso generale il meccanismo del discreto resta più o/meno lo stesso, ben- 
ché nella dimostrazione occorra usare, non il fatto che la funzione si annulla 
fuori della buca di potenziale, ma solo il fatto che essa decresce all’infinito e che è 
a quadrato sommabile. 


Numeri quantici dell’elettrone nell’atomo d’idrogeno. 1 livelli di energia del- 
l’elettrone nell’atomo d’idrogeno sono enumerati in ordine crescente in modo na- 
turale mediante il numero quantico principale #= 1, 2, 3, ... Ma ad ogni x: corri- 
sponde non una funzione ), ma tutto un sottospazio lineare in I. Questo sotto- 
spazio, per la simmetria sferica dell'equazione di Schròdinger per l’atomo libero, 
è invariante rispetto alle rotazioni dello spazio R° degli argomenti della funzione y. 
Esso si scompone in una somma diretta di sottospazi irriducibili di dimensione 
finita, invarianti rispetto al gruppo delle rotazioni, ognuno dei quali è caratteriz- 
zato da un numero intero / che può assumere i valori /=0, 1, ..., m—1. Questo 
numero quantico / può essere anche caratterizzato in termini di osservabile del 
momento angolare totale: sugli stati corrispondenti il suo valore è uguale a 
(1/27)VI(1+1). Fissando il numero quantico principale n e il numero quantico 
orbitale /, ancora non si ottiene in modo univoco la funzione Y: lo spazio irridu- 
cibile corrispondente ha dimensione 2/+ 1. Ponendo l’atomo in un campo magne- 
tico diretto, per esempio, lungo uno degli assi coordinati, viene a mancare la 
simmetria sferica e si può studiare l’azione del gruppo delle rotazioni attorno a 
quest’asse sulla funzione ) leggermente perturbata. Le rappresentazioni irridu- 
cibili del gruppo delle rotazioni sono a una dimensione e vengono numerate con 
numeri interi: al numero w, in presenza di una rotazione di un angolo $, corri- 
sponde la moltiplicazione della funzione y per e°**, Il numero m — numero quan- 
tico magnetico — può assumere i valori —/<m<. Esso corrisponde alla osser- 
vabile «componente del momento angolare nella direzione del campo », la quale 
può assumere i valori 4/27. I numeri n, /, 1 definiscono completamente in pri- 
ma approssimazione lo stato dell’elettrone. 

Tuttavia in una descrizione più esatta risulta che l’elettrone ha ancora un gra- 
do di libertà interno non classico, chiamato spin. L’osservabile dello spin ha due 
autovalori, + 1/2, ma essa agisce non nello spazio iniziale di Hilbert I, ma nello 
spazio TDK della funzione V «a due componenti». In altre parole, se si vuole 
considerare questa osservabile, bisogna estendere lo spazio di Hilbert del siste- 
ma, aggiungendo agli argomenti della funzione v un nuovo argomento discreto, 
s, che assume due valori. Corrispondentemente bisogna ridefinire le osservabili, 
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in particolare l’osservabile dell'energia; a quest’ultima bisogna aggiungere un 
termine relativistico, la «perturbazione dello spin». 

Pertanto in questa descrizione uno stato puro dell’elettrone nell’atomo d’idro- 
geno è caratterizzato da quattro grandezze discrete, x, /, m, s, le quali appaiono o 
dagli autovalori di operatori con spettro discreto, oppure quali caratteristiche di 
simmetria del sistema, cioè quali invarianti delle rappresentazioni irriducibili dei 
gruppi di simmetria. 


Nubi elettroniche e principio di Pauli. La descrizione data sopra dei numeri 
quantici dell’elettrone si riferisce solo, a rigore, all’elettrone nel campo sferico 
simmetrico coulombiano del nucleo a simmetria sferica. Tuttavia, con una certa 
approssimazione, essa può essere usata anche nel caso di atomi con più elettroni, 
ritenendo che ognuno di essi si muova in un campo che è la somma del campo del 
nucleo e di quello mediato degli altri elettroni. Se £, e s, sono le coordinate e lo 
spin dell’a-esimo elettrone, la funzione Y dell’atomo dovrà essere una certa fun- 
zione W(..., £,, Sa) ---) Gli elettroni sono indistinguibili, cioè la funzione che si 
ottiene dalla precedente permutando gli argomenti (&,, sy) deve descrivere lo 
stesso stato. Si può dare un fondamento alla proposizione secondo la quale, per 
ogni permutazione degli argomenti ($#,, 5a), la funzione dev'essere moltiplicata 
per un fattore di fase e‘, Dalle proprietà del gruppo simmetrico segue che questo 
fattore può essere uguale solo a +1. Il principio di Pauli afferma che esso è uguale 
a —1, cioè che la funzione y dell'atomo è antisimmetrica rispetto alla permuta- 
zione degli elettroni. Poiché essa non è nulla, in un atomo nello stato stazionario 
non vi possono essere due elettroni in uno stesso stato, cioè con gli stessi numeri 
quantici (7, la, #1, 54). È, questo, il famoso principio di esclusione. Le nubi 
ricordate nel $ 1.1 sono insiemi di elettroni con numeri quantici n, / assegnati. 


Spettri di massa e interazioni delle particelle elementari. Benché attualmente 
non esista una teoria conseguente delle particelle elementari che fornisca una 
spiegazione degl’invarianti discreti ad esse connessi (spettri di massa, numeri 
quantici), si hanno delle teorie semifenomenologiche assai soddisfacenti, nelle 
quali questi invarianti appaiono quali caratteristiche di rappresentazioni di diversi 
gruppi di simmetria. 


Fotoni e quantizzazione del campo. Ilcampo elettromagnetico classico è dato 
dai valori dei vettori E e H in ogni istante del tempo e in ogni punto dello spazio. 
In accordo con l’idea generale della meccanica quantistica, ad essi devono corri- 
spondere delle osservabili, cioè degli operatori dipendenti dai punti dello spazio- 
tempo. L’osservabile dell'energia sarà pure un operatore. Alla densità dell’ener- 
gia, trasportata dal campo con frequenza v, corrisponde, nella teoria quantistica, 
la densità della probabilità di osservare un quanto di energia hy, cosî che in que- 
sta interpretazione il « discreto » dei fotoni è pure legato allo spettro discreto del- 
l'operatore dell’energia. Lo spazio di Hilbert degli stati dell’elettrodinamica quan- 
tistica, in generale, contiene dei sottospazi che corrispondono ai « diversi numeri 
di particelle». Essi sono sottospazi propri dell’osservabile discreta «numero di 
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particelle». L'evoluzione del vettore di stato in questo spazio descrive i diversi 
processi di annichilazione e di creazione di particelle e di quanti, che avvengono 
nelle interazioni tra il campo e la materia. Le difficoltà matematiche della teoria 
dei campi quantizzati sono tutt’altro che superate. L’elettrodinamica quantistica 
è quella che si trova a uno stato più perfezionato; in essa i metodi di calcolo si ba- 
sano sullo sviluppo in serie di potenze nella costante di «struttura fine ). Queste 
serie della teoria delle perturbazioni divergono, ma, limitandosi ad un numero 
finito di termini ed utilizzando vari metodi euristici di rinormalizzazione, si ot- 
tengono risultati che sono in ottimo accordo con gli esperimenti. 

Ancor prima dell’apparizione della moderna elettrodinamica quantistica Di- 
rac usò un’altra procedura di quantizzazione del campo per spiegare i processi di 
radiazione e di assorbimento dei fotoni da parte dell'atomo. Essa è basata sul 
fatto che un campo elettromagnetico in un dominio con pareti assolutamente ri- 
flettenti è rappresentato dalla sovrapposizione di una successione numerabile di 
«oscillazioni fondamentali). Le equazioni di Maxwell che descrivono questo 
campo coincidono formalmente con le equazioni della meccanica hamiltoniana 
per un sistema di infiniti oscillatori. Applicando a sottoinsiemi finiti di tali oscil- 
latori la procedura di quantizzazione più sopra descritta e passando al limite ri- 
spetto al numero degli oscillatori inclusi, Dirac ottenne una buona descrizione 
qualitativa dei salti quantici del sistema formato da atomi e campo elettroma- 
gnetico. 


1.4. Difficoltà di raccordo tra teorie macroscopiche e microscopiche. 


La teoria fondamentale del «mondo in grande», cioè la teoria della relatività 
generale, e la teoria fondamentale del «mondo in piccolo», cioè la meccanica 
quantistica, non concordano sia per il loro apparato formale, sia per i principî 
fisici sui quali queste teorie si basano. In particolare nella teoria della relatività 
generale non vi è posto per gli effetti quantici dell’indeterminazione e della flut- 
tuazione probabilistica, mentre in meccanica quantistica non si considerano la 
curvatura dello spazio-tempo e, in generale, le interazioni gravitazionali, quest’ul- 
time essendo, a distanze microscopiche, eccezionalmente deboli. Se si misura la 
forza delle interazioni fondamentali mediante la relazione tra l’energia tipica del- 
l'interazione e la massa delle particelle interagenti, e se si assume uguale a 1 la 
caratteristica dell’interazione forte, si ricava che l’interazione elettromagnetica è 
dell’ordine di 10-?, quella debole è circa 10-5, mentre quella gravitazionale è del- 
l’ordine di 10-*8. Tuttavia, a fondamento di tutte e due le teorie vi è la conce- 
zione generale dello spazio-tempo differenziabile, quest’ultimo intervenendo 
quale ambiente dell'evoluzione della metrica, della materia e dell’energia nella 
teoria della relatività generale, e della funzione d’onda nella meccanica quanti- 
stica, Perciò occorre prima di tutto giudicare i fondamenti fisici di questa con- 
cezione. 


I punti dello spazio-tempo. Come si è già ricordato, un punto dello spazio- 
tempo è l’idealizzazione di un processo fisico localizzato in un piccolissimo do- 
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minio dello spazio e di durata brevissima. Si consideri una particella materiale di 
massa m. Nella teoria della relatività generale si può definire una lunghezza ca- 
ratteristica, il raggio gravitazionale a, = 24m/c®, nei limiti della quale la curvatura 
dello spazio vicino alla particella diventa essenziale. Se si considera la particella 
puntiforme, il potenziale gravitazionale internamente a una sfera con tale raggio 
è cosi grande che da questa sfera verso l'esterno non potrebbe uscire alcun se- 
gnale; l'energia dei fotoni non è sufficientemente grande perché essi possano su- 
perare l'attrazione. Più geometricamente, si può dire che nell’interno di questa 
sfera si forma un dominio dello spazio-tempo « chiuso in se stesso », cioè un «buco 
nero ». Ciò è vero anche per una particella di raggio non nullo a, se esso è minore 
di a,, ed è vero per i corpi macroscopici. Il raggio gravitazionale del Sole è circa 
2,5 km, cosi che questo dominio è interno al Sole. Tuttavia buchi neri possono 
formarsi attorno a stelle molto dense e persino intorno ad addensamenti di ma- 
teria con una densità dell’ordine di 1 g/cm?, ma di grandi dimensioni. Nel micro- 
mondo, quanto più esattamente vogliamo localizzare una particella, tanto mino- 
re dev'essere il suo raggio gravitazionale a,, cioè tanto minori devono essere la 
sua massa 7 € il suo raggio 4. Ma allora la densità della materia internamente alla 
sfera di raggio gravitazionale, per a a,, cresce come 1/m?, ciò che può superare 
le densità note delle particelle elementari. Si osservi che le particelle elementari 
con massa a riposo nulla, cioè fotoni e neutrini, non possono servire per la localiz- 
zazione spaziale, poiché si muovono con la velocità della luce. In ogni caso, nel- 
l'ambito della teoria della relatività generale la localizzazione di una particella ri- 
chiede che la sua massa e il suo raggio tendano a zero. 

Nell'ambito della meccanica quantistica, invece — come mostra l’analisi con 
l’aiuto del principio d’indeterminazione —, una particella di massa m non può es- 
sere localizzata con precisione maggiore di 4/27tmc e ciò richiede che m tenda al- 
infinito. Pertanto un esperimento ideale per identificare un punto dello spazio- 
tempo nella teoria della relatività generale e in meccanica quantistica presenta 
esigenze contraddittorie. 


Fluttuazioni quantistiche della metrica. Se il campo gravitazionale su scala 
di grandezza piccola è soggetto alle ipotesi della meccanica quantistica, i coeffi- 
cienti g,, della metrica dello spazio-tempo devono essere trasformati nei valori di 
certe osservabili quantistiche e perciò diventare non completamente definiti, ma 
solo oscillare attorno a valori medi. La dimensione di queste oscillazioni definisce 
il dominio entro il quale la fluttuazione della distanza fra due punti è confrontabile 
con questa distanza e perciò è come se perdesse senso la localizzazione rigorosa 
dei punti. 

È per questo che non cessano i tentativi di trovare schemi di quantizzazione, 
non solo dei processi fisici che si svolgono nello spazio-tempo, ma anche dello 
stesso spazio-tempo. Se questi tentativi saranno coronati da successo, saremo 
testimoni di nuovi sorprendenti fenomeni coinvolgenti il discreto continuo nelle 
stesse caratteristiche fondamentali dell’esistenza. 
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2. Informazione. 


2.1. Considerazioni generali. 


Una parte notevole di questo paragrafo è dedicata ai sistemi viventi, da quelli 
cellulari e subcellulari a quelli ecologici e sociali. Per questi sistemi sono caratte- 
ristici un’eccezionale complessità di organizzazione e un alto grado di concor- 
danza nei processi fondamentali spaziali e temporali. La coordinazione che ga- 
rantisce la nascita, la crescita e lo sviluppo di tali sistemi si realizza mediante una 
rete complessa di flussi d’azione che verranno considerati flussi d’informazione 
nel senso più esteso della parola. Il ruolo del continuo /discreto nei diversi processi 
di generazione, trasmissione, conservazione ed elaborazione delle informazioni 
verrà esposto su alcuni esempi. Saranno considerati i processi di codificazione, 
di trasmissione da organismo a organismo e di utilizzazione dell’informazione 
ereditaria che assicurano il ricambio delle generazioni biologiche e l'evoluzione del 
mondo vivente del nostro pianeta. Si passerà poi ai processi di regolazione nel- 
l'organismo vivente che si realizzano mediante il sistema nervoso ed endocrino. 
Il tema successivo sarà il «linguaggio degli animali»: i meccanismi di trasmis- 
sione delle informazioni nei sistemi ecologici. Infine si esamineranno le lingue 
naturali dell’uomo: scrittura e mezzi tecnici per conservare ed elaborare i dati. 

Analizzando la struttura dei sistemi naturali d’informazione possiamo ten- 
tare di enunciare un problema che non si può impostare nell’ambito dei feno- 
meni fisici. Perché l’ereditarietà è regolata mediante un meccanismo con una 
componente spiccatamente discreta, quando, invece, nei processi di ricambio 
e di crescita il ruolo più importante è svolto da una regolazione ormonale con- 
tinua? Più esattamente, quali sono i vantaggi e gli svantaggi dei metodi discreti 
e continui nella rappresentazione ed elaborazione delle informazioni con rife- 
rimento al sistema di funzioni da compiere? 

Tali questioni sono state discusse attivamente negli ultimi decenni in seguito 
all'apparizione delle macchine calcolatrici analogiche e di quelle digitali. Nelle 
prime i numeri si realizzano materialmente mediante i valori di alcune grandezze 
fisiche quali l'angolo di rotazione di un asse, o l’intensità di una corrente elettrica, 
o la sua tensione, che possono variare con continuità entro certi limiti. Nelle se- 
conde i numeri vengono rappresentati, cosf come nei testi stampati, nel sistema 
di numerazione binaria, o in un altro sistema, con successioni di « cifre ». Le « cifre» 
oeIsirealizzano rispettivamente con uno dei due stati stabili di un elemento elet- 
tronico. La logica dell’elaborazione delle informazioni nei dispositivi analogici 
in una certa misura imita i processi naturali: se l’integrale {T'v(t)dt significa 
lo spazio percorso durante il tempo 7 con velocità locale v(#), in una macchina 
analogica si può porre un condensatore sotto carica con velocità v(#) e poi misu- 
rare la sua carica dopo un tempo 7. La logica dell’elaborazione delle informa- 
zioni nei dispositivi discreti imita i processi di calcolo dei matematici, nei quali 
sì tratta sostanzialmente e in fin dei conti di sommare o moltiplicare cifre binarie 
o decimali, ripetendo questa procedura un enorme numero di volte in corrispon- 
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denza ad un sistema di regole complessivamente organizzato per la scelta delle 
operazioni successive, 

Le differenze nelle caratteristiche dei calcolatori analogici e digitali sono inol- 
tre legate alla precisione nella rappresentazione delle informazioni, alla velocità 
della loro elaborazione e alle caratteristiche dei dispositivi di memoria. La preci- 
sione relativa in una rappresentazione analogica può essere dell'ordine di 1073 
e praticamente non supera mai 105; un aumento della precisione richiederebbe 
dispositivi di un’enorme complessità. La precisione relativa in una rappresen- 
tazione discreta teoricamente non ha limiti; per accrescerla si richiede solo di au- 
mentare il numero delle cifre, oppure di realizzare metodi opportuni di program- 
mazione. D'altro lato, per la maggior parte dei calcoli scientifici ed economici, nei 
dati in uscita non si richiede un’alta precisione, mentre nei dati in ingresso un’al- 
ta precisione può essere solo fittizia. L'esigenza di un’alta precisione nei risultati 
intermedi nasce invece dalle caratteristiche stesse dell’elaborazione discreta delle 
informazioni: l'enorme quantità di piccoli passi intermedi accumula gli errori. 
La velocità dei calcolatori digitali rispetto a quelli analogici mira anche in misura 
notevole a compensare la lunghezza delle procedure di calcolo. Ad ogni modo, 
allo stato attuale della tecnica, un bilancio generale propende decisamente per i 
calcolatori digitali. A ciò contribuisce non poco la loro universalità in contrap- 
posizione alla limitatezza della classe dei problemi risolvibili da ciascun calcola- 
tore analogico; fatto, questo, a fondamento della loro struttura. In linea di prin- 
cipio un grande calcolatore digitale è in grado di eseguire qualsiasi algoritmo. 
Infine, la realizzazione tecnica della memoria nei dispositivi discreti risolve ef- 
ficacemente il problema del volume e della stabilità dell’informazione da con- 
servare. 

È interessante tentare di capire in che misura questa prevalenza dell'aspetto 
discreto dell’informazione nei sistemi umani di scrittura ed elaborazione dell’e- 
sperienza sia dovuta all’essenza dei fatti, o non sia piuttosto una scelta parziale 
delle soluzioni tecniche. John von Neumann [1958] esaminò a fondo questo pro- 
blema, confrontando i principî usati nella progettazione e costruzione delle mac- 
chine calcolatrici con i principî del funzionamento del sistema nervoso centrale 
dell’uomo. Egli giunse alla conclusione che la logica interna del cervello dev’es- 
sere sostanzialmente diversa, e per molti aspetti, dalla logica dei nostri calcola- 
tori. Il sistema nervoso non può conseguire un’alta precisione (superiore a 10?, 
o 1073) nella rappresentazione delle grandezze neppure in linea di principio. 
In esso non possono quindi realizzarsi quei processi profondamente conseguenti 
che sono caratteristici dei calcolatori digitali e, in generale, delle strutture dedut- 
tive nei metodi matematici. Nel sistema nervoso hanno un’enorme importanza 
le proprietà statistiche, temporali e spaziali, dei segnali e la massa dei processi 
paralleli informativi. La componente discreta che si osserva a livello della codi- 
ficazione in impulsi-frequenze nei neuroni viene livellata attraverso una media 
spazio-temporale. La regolazione ormonale partecipa alla graduale e continua 
variazione dei parametri fondamentali che caratterizzano l'elaborazione discreta; 
per esempio, delle soglie di eccitazione. 

Probabilmente vi sono alcune cause profonde del fatto che l'aspetto discreto 
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della codificazione delle informazioni prevalga nettamente a due livelli estremi: 
a quello più profondo dell’ereditarietà biologica e a quello più superficiale del- 
la comunicazione tra le persone. A quest’ultimo livello è caratteristico l’uso della 
lingua naturale, la quale, sul piano dell'espressione, è discreta per sua natura. 
L'uso della scrittura e dei sistemi speciali di segni della matematica e di altre 
scienze naturali sottolinea ancora di più questa componente discreta. Nell'ambito 
della cultura umana è interessante mettere a confronto i linguaggi discreti della 
scienza con i linguaggi continui quali la pittura, la musica e la danza. La conti- 
nuità del linguaggio pittorico, o musicale, sul piano dell’espressione, è correlata 
con l’amorficità della sua semantica (per lo meno nelle tradizioni europee moder- 
ne) e ciò in contrasto con le caratteristiche semantiche rigide del linguaggio scien- 
tifico. L’uso della lingua naturale nella letteratura artistica e, in parte, negli studi 
umanistici occupa una posizione intermedia tra questi due casi estremi: l'epopea 
di Gilgamesh o l’Am/eto dicono qualcosa di più che non l’insieme di parole che 
formano questi testi. 

Il carattere discreto del linguaggio scientifico, sia sul piano dell’espressione 
sia su quello del contenuto, risulta indispensabile perché questo linguaggio as- 
solva le sue funzioni sociali fondamentali, cioè affinché l’uomo possa fissare, con- 
servare, elaborare e usare tutti quei dati sul mondo esterno che devono essere 
assunti in modo univoco, conservati a lungo e che devono sottoporsi ai lunghi 
processi dell’elaborazione deduttiva. 

Ma queste stesse proprietà del linguaggio scientifico inducono ad essere cauti, 
soprattutto esaminando il tema di questo paragrafo: non potrebbe essere che il 
discreto da noi osservato nei processi naturali sia in misura notevole un arte- 
fatto da noi introdotto mediante i nostri mezzi di descrizione? Esaminando il 
discreto/continuo delle osservabili fisiche abbiamo visto quanto sia non-banale 
l'interazione tra i due aspetti e i modi come uno genera l’altro persino nei modelli 
matematici non molto complessi. "Tra l’altro il mondo dei processi informativi è 
studiato assai peggio; quasi sempre siamo costretti a restare a un livello fenome- 
nologico e troppo spesso siamo inclini a far ricorso alle analogie con i sistemi di 
comunicazione artificiali. 

«L'informazione ereditaria è scritta in un codice lineare di venti lettere». 
Questa affermazione va accettata con la stessa cautela con la quale si accetta l’af- 
fermazione che la frase precedente contiene un'informazione sui successi della 
biologia molecolare. Si è costretti ad esprimere una verità continua mediante un 
aforisma discreto, ma non si deve dimenticare la differenza tra l’uno e l’altro. 


2.2. Ereditarietà. 


Una delle fondamentali generalizzazioni della biologia teorica è il concetto 
secondo il quale «tutto ciò che vive proviene dal vivente ». Attualmente non si os- 
servano autoconcepimenti spontanei della vita, benché, probabilmente, essi pos- 
sano aver avuto luogo sul nostro pianeta miliardi di anni fa. Qui non si toccherà 
questo processo. della biogenesi. 

Un nuovo organismo riceve un’informazione ereditaria codificata in strutture 
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biologiche compatte, la quale definisce la sua formazione, il suo funzionamento, 
la sua crescita e, possibilmente, la sua morte, e cosf pure i meccanismi per trasmet- 
tere ai posteri l’informazione da esso ricevuta. Gli ultimi decenni hanno dato 
molte notizie sulla forma e il funzionamento di queste strutture, di cui si dà ora 
una breve esposizione. i 

Caratteristiche degli organismi viventi direttamente osservabili sono la cre- 
scita, il moto, l'alimentazione, le reazioni alle sollecitazioni esterne, la prolifera- 
zione. Il fondamento chimico di tutti questi eventi è il metabolismo (scambio di 
sostanze). Esso consiste nella trasformazione delle sostanze assimilate con l’ali- 
mentazione in strutture dell’organismo e nell’utilizzazione delle energie liberate 
da queste sostanze. Le reazioni delle sostanze organiche, in generale, sono parti- 
colarmente lente. Per accelerarle nella cellula viva intervengono gli enzimi. L’a- 
zione di questi ultimi in primo luogo ha un carattere catalitico: una molecola di 
un enzima può agire, senza modificarsi, su una quantità enorme di molecole delle 
sostanze reagenti (substrati). In secondo luogo gli enzimi sono altamente spe- 
cializzati sia in relazione alla scelta del substrato, sia in relazione al carattere del- 
l’azione su di esso. Il carattere dell’informazione ereditaria è definito in primo 
luogo dalla qualità degli enzimi sintetizzati dalla cellula e dalle reazioni che que- 
sti stessi enzimi regolano. Gli enzimi (più esattamente, le parti delle loro mole- 
cole, cioè gli apoenzimi, responsabili del riconoscimento del substrato) sono pro- 
teine. 

La molecola della proteina ha una caratteristica lineare: essa è una catena po- 
lipeptidica, i cui anelli sono le molecole di amminoacidi, più esattamente i residui 
amminoacidici. La lunghezza di una tale catena può oscillare fra 100 e 30 000 anel- 
li. Si hanno venti tipi diversi di anelli, cioè in tutto si hanno venti amminoacidi. La 
specifica della proteina è definita in massima parte dall’esatta successione dei re- 
sidui amminoacidici nella catena polipeptidica delle sue molecole. Di regola que- 
sta successione viene letta in una direzione che nella cellula è pure univocamente 
definita. 

Ognuno dei venti amminoacidi ha la struttura seguente. A un estremo della 
molecola si trova il gruppo carbossilico COOH con proprietà acide; attraverso 
un secondo atomo di carbonio questo gruppo è unito al gruppo amminico NHy; 
inoltre a questo atomo di carbonio sono uniti un atomo d’idrogeno e il residuo 
amminoacidico. Il residuo, che definisce la specificità dell’amminoacido, può es- 
sere di struttura complessa, contenendo fino a venti atomi di carbonio. Quando 
due amminoacidi si uniscono, formando un dipeptide, si libera una molecola 
d’acqua e si forma un legame tra il gruppo amminico del primo acido e il gruppo 
carbossilico del secondo acido. In modo analogo si forma una catena polipeptidica. 
Una catena polipeptidica è intrecciata e ripiegata spazialmente su se stessa in mo- 
di diversi. Queste strutture si dicono secondarie, terziarie, ecc., a differenza di 
quella primaria che è la successione dei residui. La struttura secondaria più im- 
portante è quella a spirale. Essa è stabilizzata mediante legami di idrogeno. I re- 
sidui amminoacidici sporgono all’esterno della spirale. A una forma (a-forma) 
appartengono 3,7 legami peptidici per ogni spira; nell’altra forma (B-forma) vi 
sono 5,1 residui per ogni spira. La struttura secondaria — spirale — in certi tratti 
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può ripiegarsi, avvolgersi e anche ramificarsi, dando luogo alla struttura terziaria. 
L’unione di alcune molecole proteiche in un complesso genera la struttura qua- 
ternaria. La caratteristica di tutte queste strutture è definita dalla successione dei 
residui amminoacidici della molecola e cosi pure dall'ambiente nel quale si trova 
la molecola. A sua volta, la specificità della struttura spaziale della molecola de- 
finisce la reazione cui essa può prender parte, in particolare la scelta del substrato 
da parte dell’enzima. 

Pertanto la molecola proteica, quale supporto dell’informazione, può essere 
modellata con buona approssimazione mediante una « parola» in un alfabeto di 
venti lettere, cioè con la successione primaria dei residui amminoacidici in questa 
molecola. 

‘T'uttavia, le molecole della proteina non sono i supporti principali dell’infor- 
mazione nella cellula. Fanno parte di questi supporti altri composti organici 
fondamentali, cioè gli acidi nucleici, detti cosî perché si trovano prevalentemente 
nel nucleo della cellula. 

Le molecole di acidi nucleici sono pure catene lineari, i cui anelli si chiamano 
nucleotidi. Un nucleotide si ottiene mediante una composizione successiva di tre 
molecole: acido fosforico (lo stesso in tutti i casi), zucchero (una molecola di ri- 
boso, o di desossiriboso) e una base organica. In una molecola di acido nucleico 
vi sono solo nucleotidi con un solo tipo di zucchero; corrispondentemente gli 
acidi nucleici si dividono in due classi: desossiribonucleici (DNA) e ribonucleici 
(gna). In qualità di basi, vi possono essere nei desossiribonucleotidi solo quattro 
sostanze: adenina (A), citosina (C), guanina (G) e timina (T). Anche nei ribo- 
nucleotidi possono entrare, quali basi, solo quattro sostanze: A, C, G, oppure 
uracile (U). Una catena polinucleotidica, cioè una molecola di acido nucleico, può 
contenere da alcune decine sino ad alcuni milioni di nucleotidi. Corrispondente- 
mente una tale molecola, quale supporto dell’informazione, può essere modellata 
come una parola nell’alfabeto di quattro lettere: A, C, G, T per il DNA e A, C, G, 
U per l’RNA. Quando nella cellula si produce la sintesi di una proteina avviene un 
processo di ricodificazione di tali «parole nucleotidiche » in «parole amminoaci- 
diche» delle stesse proteine. L’interpretazione di questo codice e cosî pure la 
spiegazione dei particolari del meccanismo di ricodificazione sono tra le scoperte 
fondamentali della biologia del xx secolo. 

Punto di partenza sia la descrizione del codice. Per decifrare la successione 
dei nucleotidi bisogna suddividerla in terne, o triplette: per esempio, GAUGCU 
CCUUUU si trasforma nella successione di triplette (GAU) (GCU) (CCU) 
(UUU). A ogni tripletta di nucleotidi corrisponde un ben definito residuo am- 
minoacidico: cosi, GAU corrisponde all’acido aspartico, GCU all’alamina, 
CCU alla prolina, mentre UUU corrisponde alla fenilolanina. Pertanto, GAU, 
GCU, CCU, UUU vengono ricodificati in asparagina, alanina, prolina e feni- 
lolanina, precisamente in quest'ordine. Si osservi che tanto nel DNA quanto nel- 
RNA le triplette possibili sono di 4°= 64 tipi, mentre di amminoacidi in tutto 
se ne hanno zo. Pertanto il codice genetico è degenere: a triplette diverse può 
corrispondere uno stesso residuo amminoacidico. Cosî, per esempio, a tutte le 


triplette GUU, GUC, GUA, GUG corrisponde uno stesso acido, la valina. 
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È essenziale il fatto che questo metodo di codificazione sia altamente sensi- 
bile agli errori. È vero che, sostituendo un nucleotide con un altro, cambia solo 
una tripletta e, corrispordentemente, un solo residuo amminoacidico. Ma, per 
esempio, traslando l’inizio della lettura di una sola unità, può cambiare tutta la 
successione di triplette e, corrispondentemente, ciò può condurre alla sintesi di 
una proteina assolutamente diversa. Nel nostro esempio, cominciando dalla secon- 
da lettera, si ottiene la successione di triplette (AUG), (CUC), (CUU), (UU...) 
e quindi la sintesi del polipeptide metiomina-leucina-leucina-... Si produce un 
effetto analogo se viene a cadere un nucleotide, a cominciare dal posto dove man- 
ca, oppure se ne viene introdotto uno in più. Questo carattere altamente discreto 
della scrittura, lettura, ricodificazione e reazione agli errori nel codice genetico, 
definisce il ruolo delle mutazioni nelle modificazioni degli organismi viventi. 
Le mutazioni sono variazioni casuali discontinue dell’apparato genetico che si 
producono per l’influenza di fattori chimici, di radiazioni, di fluttuazioni di ca- 
lore, ecc. Esse possono interessare i geni e i cromosomi; consistere nella varia- 
zione, nella perdita, o nella rotazione di 180° di un tratto della catena, ecc. 

Si dà ora, brevemente e con notevoli semplificazioni, la descrizione del pro- 
cesso stesso di elaborazione dell’informazione ereditaria. 

Ogni organismo riceve dai genitori (o dal genitore) un insieme di geni. Que- 
sti sono costituiti da molecole di DNA e sono distribuiti nei cromosomi. In queste 
molecole di pNA è contenuta tutta l'informazione ereditaria necessaria per lo 
sviluppo e la vita dell'organismo. Nella forma stabile una molecola di DNA è 
costituita non da una, ma da due catene polinucleotidiche, che si avvolgono l’una 
sull’altra formando la famosa doppia elica. Questa struttura è definita in base 
alla legge di complementarità: i legami d’idrogeno uniscono le coppie di basi 
che nelle due catene si trovano una di fronte all’altra. Nel DNA sono possibili 
solo le coppie (AT), (CG) e quelle ad esse speculari; nell’RNA sono possibili ri- 
spettivamente (AU) e (CG). Questo principio di complementarità, che è una 
variante della codificazione, svolge un ruolo fondamentale in due processi: nella 
duplicazione e nella trasmissione dell’informazione dal DNA alla proteina. 

Nel processo di divisione della cellula la spirale DNA si sviluppa e ognuna 
delle due catene polinucleotidiche costruisce su se stessa, come su una matrice, 
la catena complementare. Quale risultato si ha la duplicazione di una copia del- 
l'informazione ereditaria. 

Il processo di trasmissione dell’informazione dal DNA alla proteina si attua 
attraverso alcuni stadi. All’inizio il DNA (una delle sue catene) costruisce su se 
stesso, secondo il principio di complementarità, la catena RNA (sono possibili 
solo le coppie (AU), (CG), (GC), (TA)): questo RNA si chiama messaggero 
(m-RNA). Le triplette di nucleotidi nell’m-RNA si dicono antitriplette. In una 
molecola di DNA è scritta sequenzialmente l’informazione sulla sintesi di molte 
proteine diverse; una molecola di m-RNA è notevolmente più corta; essa contie- 
ne l’informazione per una sola proteina, che, in base alla complementarità, si 
riferisce al tratto corrispondente della catena del DNA. 

Una lunga molecola di m-RNA lega tra loro alcune speciali formazioni intra- 
cellulari, i ribosomi, a forma di corpuscoli tondeggianti. Essi sono le «fabbriche 
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delle proteine », le quali vengono sintetizzate sulle loro superfici. In particolare 
essi trattengono le molecole di m-RNA in uno stato disteso, ciò che rende accessi- 
bile l'informazione in esse contenuta. 

Gli amminoacidi che saranno uniti nella catena polipeptidica giungono ai 
ribosomi uniti a molecole di RNA di tipo speciale che si chiamano RNA transfer 
(t-rNA). Ogni tipo di t-RNA ha in una determinata parte della molecola una tri- 
pletta speciale di nucleotidi: la sua antitripletta. L’antitripletta definisce, da un 
lato, quel tipo di amminoacido che questo RNA è in grado di trasportare, e dal- 
l’altro lato, quella (anti)tripletta dell’m-RNA sul ribosoma, con la quale è in grado 
di unirsi questa molecola di t-RNA insieme con il suo residuo amminoacidico. 
Dopo che a un m-RNA, in due triplette contigue, si sono unite due molecole di 
t-RNA con i residui, tra esse si forma un legame peptidico; una delle molecole 
di t-RNA si libera, si stacca dal ribosoma e può di nuovo compiere la sua funzione. 
In tal modo, sequenzialmente, si costruisce la catena polipeptidica. Dopo che 
questa si è completata, essa si divide dal ribosoma e si attorciglia, assumendo 
le sue strutture secondaria e terziaria. 

Riassumendo, si può dire che in tutti i tratti da noi considerati, nei quali 
inizia la catena di trasmissione dell’informazione ereditaria, dominano le strut- 
ture discrete: le piccole unità messaggere, i nucleotidi e i residui acidi si orga- 
nizzano in un sistema lineare con rigide regole di ricodificazione. Nell'ultimo 
stadio di questa catena il discreto si esprime mediante il principio «un gene - un 
enzima - una reazione ». Le reazioni che avvengono nella cellula hanno una strut- 
tura spazio-temporale già cosi complessa che, per poter spiegare le loro caratte- 
ristiche continue/discrete, bisogna passare a un altro livello di descrizione. 

Omettendo per necessità ulteriori particolari e tralasciando l’enorme gerar- 
chia dei successivi livelli, non si può non accennare per sommi capi al manife- 
starsi di questa organizzazione discreta dell’informazione genetica a livello del- 
l'individuo, della popolazione e della specie. 

Prima di tutto la costituzione genetica che l'organismo eredita dai suoi geni- 
tori, cioè il suo genotipo, si manifesta esternamente in un insieme di caratteri 
visibili che costituiscono il fenotipo dell'organismo. I caratteri fenotipici posso- 
no essere morfologici (colore, grandezza, forma del corpo, o di sue parti), oppu- 
re fisiologici (presenza o assenza di un determinato enzima). Nel caso più sem- 
plice il carattere fenotipico è controllato (regolato) da un solo gene di un dato 
carattere. Nella riproduzione bisessuale l’organismo riceve dai genitori due geni 
di ciascun sesso: uno paterno e l’altro materno. Essi possono corrispondere a 
forme diverse del carattere fenotipico. Per esempio, nel genotipo di uno stesso 
uomo vi può essere il gene degli occhi castani, ricevuto dal padre, e il gene degli 
occhi celesti, ricevuto dalla madre. Uno di questi geni può definire completa- 
mente il carattere e, in tal caso, esso si dice dominante, mentre l’altro si dice 
recessivo. Può anche accadere che l’azione contemporanea di due geni conduca 
a una scala di gradazioni del carattere fenotipico. È, questo, uno dei fattori della 
continua variabilità del fenotipo. Un altro fattore è l’influenza dell'ambiente 
esterno. Nei mammiferi uno dei meccanismi genetici dove l’azione discreta si 
manifesta in modo più evidente è quello della regolazione del sesso. 
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L’evoluzione di questa o quella forma degli organismi viventi avviene nel 
processo di avvicendamento delle nuove generazioni d’individui, viventi in un 
determinato territorio e che s’incrociano tra loro: si tratta di una popolazione 
genetica. Il genotipo di ogni individuo è unico, ma la frequenza media di varietà 
(allele) di ogni gene in una grande popolazione è relativamente stabile. Per l’evo- 
luzione è essenziale alterare questa stabilità e ciò avviene grazie ai processi di 
mutazione, alle rigenerazioni selettive e, nelle piccole popolazioni, alle fluttua- 
zioni casuali del fondo genico. Infine, può verificarsi un afflusso di geni da un’al- 
tra popolazione. La media delle variazioni discrete del fondo genico, rispetto 
a una grande popolazione, produce l’effetto di un’evoluzione continua. Una 
brusca variazione delle condizioni esterne che conduca a una selezione e a una 
successiva rigenerazione d’individui, con uno specifico genotipo (apparso, pro- 
babilmente, quale risultato di mutazioni), si presenta come un salto evolutivo. 
I salti evolutivi si notano in modo particolare negli organismi primitivi con un 
fondo genico povero. I virus, costituiti quasi esclusivamente da materiale gene- 
tico, subiscono in modo particolarmente facile variazioni e salti. Sono largamen- 
te noti gli esempi forniti dai virus delle infezioni influenzali. 

Esiste l’ipotesi che gli uccelli, considerati quale classe zoologica, si poterono 
formare da antenati pennuti a conclusione di un’unica mutazione, nella quale si 
è accorciata la loro lunga coda (simile a quella dei rettili con le penne), ciò che 
migliorò nettamente le loro caratteristiche aerodinamiche. La possibilità di una 
tale mutazione si dimostra con l’esempio dei gatti senza coda dell’isola di Man. 

Un gruppo di popolazioni con un fondo genico cosî comune che tra loro 
siano possibili gl’incroci si chiama specie. Le frontiere tra le specie, pur non es- 
sendo barriere assolute, sono definite in modo sufficientemente netto dall’in- 
compatibilità dei genotipi, i quali ostacolano la riproduzione di forme interme- 
die. La presenza di queste frontiere è ancora una manifestazione del discreto 
nell’informazione genetica. Nella formazione delle specie possono influire di- 
versi fattori isolanti, che ostacolano l’incrocio tra sottogruppi della popolazione 
e che, nel processo dello sviluppo evolutivo, favoriscono la divergenza dei loro 
fondi genici in direzioni diverse. 


2.3. Il sistema nervoso e il sistema endocrino. 


La trasmissione delle informazioni all’interno di un organismo pluricellulare 
complesso viene attuata fondamentalmente da due sistemi specializzati: quello 
nervoso e quello endocrino. Il sistema nervoso controlla prevalentemente le 
reazioni veloci (la cui durata non supera il millisecondo), mentre quello endocri- 
no controlla le reazioni lente, di lunga durata. In entrambi i sistemi l’interazione 
intercellulare si attua mediante la secrezione di sostanze speciali, cioè è quasi di 
tipo analogico. Nelle cellule nervose la trasmissione intracellulare delle informa- 
zioni avviene mediante impulsi elettrici, aventi una caratteristica discreta. T'ut- 
tavia la stessa codificazione delle informazioni usa proprietà statistiche spazio- 
temporali degli impulsi. i 
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Il sistema nervoso. Negli organismi pluricellulari esso consiste di cellule 
specializzate: i neuroni. In un tipico neurone si individuano le parti seguenti: 
a) un’appendice recettiva (dendriti); 5) un luogo per la generazione degli im- 
pulsi nervosi (solitamente il tratto iniziale di una lunga appendice, l’assone); 
c) un elemento conduttore, lungo il quale scorrono velocemente gl’impulsi, l’as- 
sone; d) una parte terminale dell’assone, dove avviene la secrezione dei mediatori 
verso l’appendice recettiva di un altro neurone; e) il corpo del neurone (perica- 
rio, soma), che sostanzialmente svolge funzioni trofiche. L’unità funzionale del 
sistema nervoso viene assicurata da legami interneuronici, realizzati mediante 
sinapsi. Nelle sinapsi tra i neuroni vi è una sottile fessura fra il tratto di mem- 
brana della parte terminale del neurone presinaptico e il tratto di membrana 
della parte recettiva del neurone postsinaptico. Il numero di neuroni in tutto il 
sistema nervoso dell’uomo è dell’ordine di 10!°. I neuroni della spina dorsale e 
del cerveito formano il sistema nervoso centrale; gli altri formano il sistema 
nervoso periferico. Il percorso tipico di un segnale dall'ambiente esterno è il 
seguente: le cellule recettive (recettori cutanei, cellule del gusto, recettori della 
vista, ecc.), sottoposte all’azione di uno stimolo esterno, inviano attraverso le 
sinapsi un segnale ai dendriti terminali dei neuroni, i quali portano il segnale 
al sistema nervoso centrale. In questo percorso i neuroni si dicono afferenti. 
Nella direzione inversa i neuroni efferenti trasmettono i segnali dal sistema ner- 
voso centrale agli organi esecutivi: muscoli, ghiandole, ecc. Nello stesso sistema 
nervoso centrale avvengono i processi fandamentali di ricezione, coordinazione, 
elaborazione e conservazione dell’informazione. 

Considerando più da vicino il modo di rappresentare e trasmettere le infor- 
mazioni da parte di un neurone, si rileva che il fondamento fisico è costituito 
dagl’impusi nervosi, o potenziali d’azione, che sono variazioni di breve durata 
del potenziale elettrico tra gli elettroliti da ambo i lati della membrana neuroni- 
ca. Queste variazioni si propagano attraverso le appendici del neurone e hanno 
forma d’impulsi. Secondo le moderne interpretazioni, gl’impulsi che corrono 
lungo le fibre nervose sono omogenei, nel senso che la loro forma e grandezza 
non contiene informazione (almeno in determinati limiti); essenziale, invece, è 
la frequenza degl’impulsi e cosî pure l'insieme delle fibre nervose attive. Pertan- 
to, di per sé gl’impulsi hanno un carattere discreto, mentre la loro densità spa- 
ziale e temporale è relativamente continua, ciò che assicura, per esempio, la 
possibilità di una sottile graduazione delle reazioni motorie. Una secoda compo- 
nente essenzialmente continua del processo di elaborazione delle informazioni 
viene realizzata nelle sinapsi. Un impulso nervoso, quando giunge alla termina- 
zione presinaptica, provoca la secrezione di sostanze speciali, i mediatori. Il 
mediatore si diffonde attraverso una stretta fessura sinaptica e agisce sulla mem- 
brana del neurone contiguo postsinaptico. Quest’azione può essere di carattere 
eccitante o inibitorio, provocando un aumento o una diminuzione del potenzia- 
le della membrana postsinaptica. Le sinapsi inibitorie sono di eccezionale im- 
portanza. In certe intossicazioni, quando la loro azione viene bloccata, il sistema 
nervoso viene preso da forti scariche convulsive in grado di uccidere l’organi- 
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smo. Naturalmente ciò è solo la manifestazione esterna di alterazioni assai gravi 
nei processi fini di elaborazione delle informazioni, dove inibizione e «censura» 
sono non meno importanti che la produzione di segnali. Nel sistema nervoso 
centrale dei mammiferi giungono ad ogni cellula postsinaptica le terminazioni 
presinaptiche di alcuni neuroni: parte sono inibitori e parte sono eccitanti. Le 
sorgenti dei segnali originali possono trovarsi in parti molto lontane dal sistema 
nervoso. 

I segnali che giungono a un neurone vengono presi in conto con pesi diver- 
si; il segno di questi è determinato dal carattere della sinapsi (eccitante, o inibi- 
toria), mentre la grandezza assoluta dipende dalla distanza della sinapsi dal luo- 
go di generazione degl’impulsi. Soprattutto le azioni eccitanti e inibitorie hanno 
un certo tempo di attenuazione. Se la somma delle eccitazioni supera una certa 
soglia, il neurone comincia esso stesso a generare gl’impulsi. In conclusione 
ogni neurone agisce come un sommatore non-lineate e un trasformatore di fre- 
quenze. È 

‘T'utti questi meccanismi dànno luogo alla possibilità di tipi diversi di elabo- 
razione delle informazioni, realizzate in particolare nei nuclei sensoriali di com- 
mutazione. L'informazione può subire commutazioni in un verso o in un altro; 
può essere intensificata, indebolita o filtrata, di modo che alcune caratteristiche 
risultino attenuate e altre intensificate; può essere inviata alla memoria, oppure 
a sollecitare una reazione immediata; infine può essere ricodificata, cioè tra- 
scritta su un altro supporto materiale. I particolari di questi processi sono in- 
credibilmente vari e variabili; la non-linearità è un loro tratto caratteristico; 
l'abbondanza dei modelli matematici può essere confrontata solo con la loro 
inadeguatezza. Molte generalizzazioni sono suggestive per la loro attraente sem- 
plicità; è di Mountcastle l’audace aforisma «Il cervello è un operatore lineare», 
con ciò supponendo che tutta la non-linearità resti a carico della periferia. Ma 
se ne sa troppo poco. 

Si riportano, quale esempio, alcuni particolari sulla codificazione iniziale 
della sensazione di caldo-freddo da parte dei termorecettori cutanei. Qui si han- 
no due concezioni contrapposte sulla presenza di recettori di uno oppure di due 
tipi. La dipendenza della frequenza degl’impulsi dalla temperatura, dopo un 
periodo di adattamento, ha la forma di una curva con due massimi, ciò che, pro- 
babilmente, testimonia a favore dell’ipotesi di recettori di due tipi. Vi sono poi 
altri argomenti. D'accordo con questa teoria e secondo le misurazioni, i recettori 
del freddo, dopo l’adattamento, rispondono con una frequenza fino a 10 impulsi/ 
secondo nel tratto fino a 43 °C con un massimo intorno a 28 °C; i recettori del 
caldo rispondono con una frequenza fino a 35-40 impulsi/secondo nel tratto da 
30 a 50 °C, con un massimo intorno ai 45 °C. Ogni frequenza degl’impulsi se- 
gnala due possibili temperature solo per un tipo di recettori; per esempio, il 
recettore del freddo con 7 impulsi/secondo segnala 15 °C e 35 °C, però a 35 °C 
s'inseriscono anche i recettori del caldo, ciò che permette di distinguere queste 
due temperature. : 

Se si considerano i processi di transizione, si manifestano nuovi fenomeni. Il 
raffreddamento dei recettori del freddo da 20,5 a 15,2 °C, oppure da 35 a 31,5 °C 
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provoca una breve, ma notevole accelerazione degl’impulsi; avviene qualcosa 
come la «differenziazione » della temperatura rispetto al tempo nel significato 
matematico della parola. Tuttavia, la successiva stabilizzazione della frequenza 
degl’impulsi, in questi intervalli, avviene con modalità diverse; essa è più bassa 
con il decrescere della temperatura nel dominio «caldo » ed è più alta con il cre- 
scere della temperatura nel dominio «freddo». 

Infine, le caratteristiche dei termorecettori hanno rivelato proprietà di co- 
siddetta isteresi; le misurazioni della frequenza degl’impulsi durante il raffred- 
damento della cute da 38 °C a 14 °C e il successivo riscaldamento fino alla stessa 
temperatura iniziale hanno dato curve diverse sul tratto ascendente e discen- 
dente, benché raffreddamento e riscaldamento siano stati effettuati gradata- 
mente, con intervalli per l'adattamento. 


Il sistema endocrino. Le variazioni prolungate di adattamento (legate al me- 
tabolismo, alla crescita, alla riproduzione), le concentrazioni di diverse sostanze 
nel sangue e dei liquidi esocellulari sono regolate da sostanze speciali: gli ormo- 
ni, distribuiti nell'organismo dal flusso del sangue. Alcuni ormoni sono prodotti 
da neuroni (le cosiddette cellule neurosecernenti). Gli ormoni sono molto attivi 
e la loro concentrazione nel sangue non è grande. Gli ormoni sono prodotti 
dalle ghiandole endocrine, quali la tiroide, l’ipofisi, le ghiandole surrenali. Il 
pancreas, le ovaie e i testicoli producono, oltre agli ormoni, anche secrezioni im- 
messe attraverso i cosiddetti condotti escretori. 

Alcuni ormoni influiscono sul metabolismo in tutte le parti del corpo. Tale 
è la tirosina; prodotta dalla tiroide, la quale accresce l’intensità del metabolismo 
fondamentale. La parte anteriore dell’ipofisi produce l’ormone della crescita, 
che agisce sul metabolismo proteico, lipidico e dei carboidrati e che regola la 
crescita delle ossa e quella generale del corpo. 

Tuttavia, la maggioranza degli ormoni ha specifici « destinatari», benché il 
flusso del sangue li distribuisca per tutto l'organismo. Cosi la mucosa dell’inte- 
stino duodenale produce una secrezione che agisce solo sul pancreas, stimolando 
la produzione di succo pancreatico. Le cellule che ricoprono i follicoli dell’ovaia 
femminile producono l’estradiolo, il quale stimola lo sviluppo e la conservazione 
dei caratteri sessuali femminili. 

Nei casi più elementari l'ormone può essere considerato quale semplice sup- 
porto dell’informazione, o dell’istruzione, scritta in forma «analogica». Tale è 
in prima approssimazione l’azione della secretina. 

Tuttavia, nella maggior parte dei casi le azioni ormonali sono riunite in un 
sistema con cicli di retroazioni e, qualche volta, connesse evidentemente con 
il sistema nervoso. 

Per esempio, la concentrazione di glucosio nel sangue viene regolata da due 
ormoni: l’insulina e il glucagone. La concentrazione di glucosio nel sangue cre- 
sce dopo un’alimentazione ricca di carboidrati. Una parte del glucosio entra nel 
fegato, dove viene trasformato in riserva di glicogeno. Un aumento del livello 
di glucosio provoca la secrezione dell’insulina da parte di speciali f-cellule delle 
isole del pancreas. L’insulina accresce rapidamente il trasporto di glucosio nelle 
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cellule dei muscoli scheletrici e dei tessuti adiposi. Se la concentrazione del glu- 
cosio nel sangue scende sotto il livello ottimale, comincia la secrezione del gluca- 
gone da parte delle cellule del pancreas. Il glucagone attivizza un sistema specia- 
le del fegato, nel quale il glicogeno di riserva viene trasformato, in alcune tappe, 
in glucosio e immesso nel sangue. 

Ancora più sottilmente viene bilanciato il meccanismo di regolazione dei 
cicli mestruali in alcuni mammiferi. Il concepimento è possibile solo quando un 
determinato tipo di comportamento sessuale esterno della femmina concorda 
nel tempo con l’ovulazione e lo stato della mucosa del suo utero. Alla regolazio- 
ne di questi eventi partecipano almeno otto ormoni e il sistema nervoso centrale. 

Notiamo infine l’esistenza di mezzi chimici per trasmettere l'informazione 
da un organismo a un altro. Si chiamano ferormoni ‘una classe generale di so- 
stanze che si diffondono nell'ambiente esterno da ghiandole endocrine e, rece- 
pite attraverso gli organi di olfatto e di gusto, influiscono sul comportamento e 
sulle funzioni fisiologiche di altri individui, generalmente della stessa specie. 
Fanno parte dei ferormoni gli attrattivi sessuali (nelle farfalle), i marcatori di 
tracce e i segnali di allarme (nelle formiche). Queste sostanze influiscono imme- 
diatamente sul comportamento degli individui. La regolazione della crescita del- 
le cavallette e la regolazione del numero deg’individui sessuati e dei soldati nelle 
colonie di termiti si realizzano anch'esse mediante i ferormoni, l’azione dei quali 
è più prolungata nel tempo e dà inizio a un’intera catena di fenomeni fisiologici 
complessi. 

I ferormoni, similmente agli ormoni, agendo in concentrazioni molto piccole, 
compiono precise funzioni segnaletiche. Cosi, la femmina del baco da seta pro- 
duce il suo attrattivo sessuale, il bombicolo, e lo emette nell’aria. Con un vento 
leggero le molecole di bombicolo di una sola femmina possono diffondersi in 
un’area dell’ordine di un chilometro quadrato. Queste molecole agiscono su re- 
cettori disposti sulle antenne del maschio. Esperimenti e semplici calcoli mo- 
strano che l’azione di 10%-108 molecole di bombicolo è già sopra la soglia d’ecci- 
tazione. 

Anche negli animali superiori hanno una determinata importanza i segnali 
chimici con modulazione continua, ma con azione relativamente discreta. Tut- 
tavia in essi cominciano a dominare i segnali recepibili dalla vista e dall’udito 
che si passa ora ad esaminare. 


2.4. Sistemi di segnalazione negli animali. 


Tutta l’informazione recepibile dagli organi di senso si può suddividere, 
grosso modo, in due classi: informazione dall’ambiente esterno e informazione 
dall’interno. Qui verrà considerata solo la prima classe; in essa si distingue una 
particolare sottoclasse di segnali, quelli recepibili dagl’individui della stessa spe- 
cie. Le componenti discrete sul piano dell’espressione (segnali) e la semantica 
(reazioni comportamentali) formano il linguaggio, che è specifico per una deter- 
minata specie nella sua interazione con il mondo esterno e nel comportamento 
sociale. 
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Per noi è interessante appunto la possibilità d’individuare queste compo- 
nenti discrete sullo sfondo di un’enorme variabilità di tutte le possibili azioni. 

Moltissimi fatti sperimentali e generalizzazioni teoriche sono stati ottenuti 
in questo campo dalla scuola etologica di Lorenz. Secondo Lorenz, le forme 
stereotipe, istintive del comportamento, condizionate ereditariamente, formano 
i componenti elementari di quelle azioni integrali quali il procacciamento del 
cibo e la riproduzione. Per esempio, il procacciamento del cibo da parte del lupo 
si compone di una catena di azioni istintive: fiutare, braccare, inseguire, ucci- 
dere la vittima. 

In generale un’azione istintiva è la risposta a uno specifico segnale esterno. 
Tuttavia la soglia dell’eccitazione varia a seconda dello stato dell’animale. Una 
gatta in un luogo con molti topi inizialmente li prende per mangiare. Ma, dopo 
essersi saziata, essa può continuare a prenderli senza ucciderli e poi scompare 
persino l’atto della cattura; la gatta si avvicina silenziosa solo ai topi più lontani, 
senza far caso a quelli più vicini. Al contrario, l'assenza di eccitanti, che inne- 
stino un’azione istintiva, può abbassare la soglia sino a zero e condurre l’ani- 
male allo stato di ricerca (Appetenzverhaltung). È proprio questo lo stato favo- 
revole per l’ammaestramento e, in particolare, per estendere il «linguaggio» 
comprensibile all'animale. 

È caratteristico il fatto che l'innesto di un’azione istintiva sia provocato dalla 
corrispondente situazione non in modo generico, ma da poche speciali caratte- 
ristiche elementari di questa situazione, dette stimoli. 

Gli uccellini fuggono alla vista di animali con occhi grandi. In una serie di 
farfalle, nel processo della loro evoluzione, ciò produsse l’apparizione di dispo- 
sitivi di difesa sotto forma di macchie a forma di grossi occhi, che diventano 
visibili quando le ali sono aperte. 

A primavera, dopo la scelta del territorio, il maschio dello spinarolo attacca 
un altro maschio che si avvicini. Lo stimolo è dato da una macchia rossa sul ven- 
tre di quest’ultimo e l’attacco può essere suscitato da un qualsiasi oggetto con 
sotto una macchia rossa. 

Questo carattere discreto degli stimoli si manifesta in modo particolarmente 
chiaro con l’esistenza di «ultrastimoli» che suscitano reazioni molto più intense 
che in condizioni normali. Un uccello può smettere di covare le proprie uova 
a favore di altre più grosse, di specie diversa, o persino a favore di pietre a forma 
d’uovo, cosî grosse che è impossibile covarle. Il becco aperto del grosso cuculo 
appena nato è un ultrastimolo che induce gli uccelli canterini ad alimentarlo. 

Gli stimoli di comunicazione all’interno di una specie, che si evolvono in- 
sieme agl’istinti che essi stessi sollecitano, possono assumere forme assai speci- 
fiche e stupefacenti. Cosi il corteggiamento e l'accoppiamento dei pesci e degli 
uccelli è accompagnato da loro vivaci colorazioni e movimenti. Questi stimoli 
si chiamano Auslòser. La loro apparizione ed evoluzione possono essere chiarite 
solo dal loro carattere discreto e segnaletico. 

I linguaggi di comunicazione interni a una specie possono contenere anche 
una componente attiva, costituita da un sistema di segnali visivi e sonori, emessi 
dall’individuo in determinate situazioni. 
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Un noto esempio è il linguaggio delle api, studiato da Frisch, con il quale 
esse si trasmettono l'informazione del reperimento di una fonte di cibo (cfr. 
fig. 1). L’ape operaia (bottinatrice), che ha trovato il cibo a una distanza di cin- 
quanta-cento metri dall’arnia, compie al ritorno una «danza circolare». Essa è 
il segnale alle altre api per una ricerca a caso in un intorno vicino all’arnia. Se 
la distanza dal cibo è superiore, fino ad alcuni chilometri, l'ape esegue la cosid- 
detta «danza oscillante», con la quale vengono indicate due caratteristiche di- 
screte della sorgente di cibo — la distanza e la direzione — e ognuna di esse viene 
descritta quantitativamente. L’ape descrive una curva all’incirca a forma di otto 
con un tratto centrale molto largo percorrendo il quale essa «vibra» il corpo la- 
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Figura 1. 


Danza oscillante dell’ape domestica. La corsa indica un punto di rifornimento posto 
venti gradi a destra del Sole quando l’ape lascia il nido. Se l’ape effettua la danza fuori 
dell’alveare (a), il tratto rettilineo della danza indica direttamente la sorgente nutritiva; 
se compie la danza entro l’alveare (5), si orienta per gravità e il punto direttamente sopra 
la testa raffigura la perpendicolare. L’angolo x (venti gradi) è identico per le due danze. 
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teralmente, con lo spostamento massimo alla punta dell'addome e il minimo 
nel capo. La distanza della fonte alimentare viene codificata dal numero di pas- 
saggi dell’ape lungo il tratto centrale e dal numero di vibrazioni dell'addome 
per ogni secondo; con il crescere della distanza diminuisce il numero dei pas- 
saggi, ma aumenta la frequenza delle vibrazioni. La direzione della fonte ali- 
mentare viene codificata dalla direzione del passaggio lungo il tratto centrale 
rispetto alla verticale del luogo; un passaggio parallelo alla verticale verso l’alto 
corrisponde a un volo verso il sole; verso il basso, nella direzione contraria; gli 
angoli intermedi corrispondono a direzioni intermedie. 

Il comportamento nuziale dei pesci e degli uccelli viene regolato da segnali 
visivi, dal linguaggio delle pose e dei loro avvicendamenti, organizzati in parti- 
colari danze tipiche della specie. 

I Primati usano sistemi di segnali acustici assai complessi, comprendenti 
fino ad alcune decine di unità «concettuali ». Per esempio, nel «linguaggio » delle 
bertucce sudafricane sono stati individuati segnali acustici indicanti minaccia 
aggressiva (abbaiamento), vicinanza di estranei, non-aggressività (sbaciucchia- 
mento), energico avvertimento per un grosso predatore, ecc. Funzioni analoghe 
sono svolte da codici e azioni segnaletiche quali la posizione delle estremità, 
della coda, delle orecchie. Gli specialisti sottolineano che l’informazione tra- 
smessa con questi segnali si riferisce in primo luogo a una disposizione emozio- 
nale di chi trasmette in quel momento, mentre la ricezione del segnale influisce 
prima di tutto sulla disposizione emozionale di chi lo riceve. Perciò la semantica 
di questi segnali, appena descritti, è la «semantica per un osservatore esterno ». 
Ciò nonostante la sua realtà è incontestabile. 

La struttura a segni dei sistemi biologici di comunicazione descritti induce 
a postulare l’esistenza, nel sistema nervoso, di meccanismi specifici, responsa- 
bili del riconoscimento e dell’elaborazione di questi segni. Probabilmente le 
possibilità di questi stessi meccanismi permisero -e assicurarono all’uomo l’uso 
della parola e della scrittura. La specificità di questi sistemi è condizionata in 
primo luogo da un'incredibile estensione dell’universo concettuale dell’uomo, 
rispetto alla limitatezza del numero di segnali elementari tra loro distinguibili 
con sicurezza. Perciò le unità sul piano del contenuto devono essere trasmesse 
mediante combinazioni di unità sul piano dell’espressione. Queste combina- 
zioni devono essere normalizzate e semanticamente orientate sul mondo esterno 
e non su una semplice trasmissione dello stato interno; esse devono essere suf- 
ficientemente discretizzate, affinché siano percepite con precisione sullo sfondo 
dei rumori e delle varianti individuali. Tutto ciò caratterizza il linguaggio umano. 


2.5. Linguaggio parlato, linguaggio scritto e matematica. 


Il linguaggio parlato a diversi livelli viene descritto con vari sistemi di unità 
discrete: fonemi, sillabe, parole, proposizioni. Il fonema, dal punto di vista acu- 
stico, è l'intervallo sonoro minimo univocamente identificabile nei limiti della 
sua mutabilità; quest’unità, nelle moderne trascrizioni fonetiche, viene indicata 
con un solo segno. Il fonema, dal punto di vista del sistema del linguaggio, è 
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l’unità minima in grado di compiere la funzione di distinzione del significato. 
Gli stessi fonemi possono essere distinti mediante caratteri differenziali ancor 
più elementari, quali vocalità-consonanza, afonicità-sonorità, ecc., una parte dei 
quali sono rilevanti in alcune lingue e non lo sono in altre. La descrizione mo- 
derna dei fonemi è il risultato di una lunga e difficile analisi, che ha permesso di 
distinguere caratteristiche astratte e discrete nel flusso del discorso, questo es- 
sendo acusticamente molto complesso e avendo inoltre un dominio di possibile 
variabilità assai continuo, ciò che si rende evidente quando si ascolta una lingua 
straniera, o quando si compiono indagini elettroacustiche. 

Le lingue non scritte delle società a struttura tribale erano caratterizzate da 
una grande mutabilità a tutti i livelli, sia nello spazio che nel tempo. La compo- 
nente sonora del discorso e il vocabolario si rinnovavano velocemente a causa 
della mancanza di un consolidamento scritto e per l’azione di diversi tabi e del- 
l'isolamento spaziale. Il frazionamento dialettale assunse la forma di una fa- 
miglia diffusa di lingue. Mikluho Maklai, che studiò le lingue papua nella se- 
conda metà del x1x secolo, notò che in villaggi a quindici minuti di cammino il 
vocabolario poteva già differire in alcune decine di parole. Gli abitanti di vil- 
laggi a un’ora di cammino l’uno dall’altro a volte quasi non si capivano tra loro, 
mentre per un viaggio di oltre un giorno potevano occorrere due-tre interpreti. 
Anche attualmente si nota un'analoga «continuità e mutabilità linguistica». I 
popoli dell’Africa a sud del Sahara usano circa duemila lingue e dialetti diversi. 

Nel consolidamento e nella normalizzazione delle caratteristiche discrete 
delle lingue ha avuto un’enorme importanza la scrittura, nelle sue forme silla- 
biche e alfabetiche. Tuttavia è essenziale osservare che i sistemi più antichi, 
pittografici e ideografici, non fissarono il discorso sonoro, ma direttamente la 
semantica della comunicazione; essi furono «una seconda lingua» dell’uomo. 
Perciò, considerarli parallelamente alla scrittura, a rigore, non è corretto. Le 
unità di espressione in queste scritture corrispondono direttamente alle unità 
di contenuto, tralasciando l’aspetto fonetico. La sintassi dei sistemi pittografici 
è prossima alla «sintassi del significato» e non alla «sintassi del discorso»; in 
particolare essa può essere assai lontana dalla linearità. 

Un tale modo di trascrivere i significati ha alcuni vantaggi essenziali, par- 
ticolarmente quando è applicato a sfere semantiche specializzate. Il discorso 
sonoro acquista in universalità, perdendo qualche volta nella comodità dell’e- 
spressione. Nei moderni sistemi di notazioni delle scienze noi osserviamo com- 
ponenti ideografiche essenziali; tale è il linguaggio internazionale delle formule 
chimiche, oppure, in un campo molto strettamente specializzato, il linguaggio 
dei « diagrammi di Feynmann)» in fisica. Questi sistemi realizzano una trasmis- 
sione diretta dell’informazione al cervello, la cui espressione a parole potrebbe 
essere estremamente difficoltosa. Da questo punto di vista è interessante mettere 
a confronto il linguaggio delle formule di struttura con il linguaggio parallelo, 
a parole, della nomenclatura chimica. La ricodificazione di una denominazione 
lineare quale «3-(-dietilammino-etil)-4-metil-7-carbetossi-metossi-2-0ss0-(1,2- 
cromo) idrocloruro » nella formula di struttura e viceversa richiede l’impiego di 
algoritmi complessi. Di più, l’importanza di tali sistemi ideografici non si esau- 
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risce assolutamente nella comodità di fissare l’informazione, ma anche perché 
si accresce notevolmente la possibilità di rielaborarla. Si toccherà più avanti 
quest’aspetto, esaminando il linguaggio simbolico della matematica. 

La scrittura geroglifica è un anello di passaggio tra quella ideografica e quella 
fonetica. Nelle sue forme più sviluppate, alle unità elementari dell'espressione 
corrispondono parole del discorso parlato, oppure nozioni definite così esatta- 
mente che la loro trasmissione nel discorso è limitata dalla scelta di alcuni sino- 
nimi, mentre la sintassi dell'espressione grafica è vicina a quella del discorso ed 
inoltre è lineare. Ma il numero delle unità espressive è estremamente grande. 

La scrittura sillabica e poi alfabetica nasce da quella geroglifica quando il 
centro di gravità si sposta dal significato del segno al suo suono nella lingua data. 
La scrittura assume sempre più un carattere enigmatico a mano a mano che la 
sintassi, a livello delle parole, viene sostituita dalla sintassi a livello delle sillabe 
e dei fonemi, staccati dai loro significati primitivi e incorporati in un sistema 
parallelo al sistema del discorso sonoro. 

Insieme e contemporaneamente si rafforza l’influenza inversa del linguaggio 
scritto sul linguaggio parlato. La grammatica sanscrita, elaborata in India oltre 
duemila anni fa, rigorosa e molto vicina a quelle moderne in base a principî 
scientifici, aveva già un aspetto normativo eccezionalmente importante, che mi- 
rava a conservare e trasmettere con precisione da una generazione all’altra i 
testi sacri e che agevolò la conservazione di questa lingua fino ai nostri giorni. 

E cosi la scrittura fissa il sistema della lingua, sottolineando i suoi aspetti 
discreti, e fissa i testi socialmente importanti in questo sistema, svolgendo il 
ruolo di una memoria stabile esterna dell'umanità. Ma la scrittura fa di più. 
La logica della lingua, fissata al di fuori della consapevolezza del portatore di 
questa lingua, apre nuove possibilità di generare testi e idee. La moderna socio- 
linguistica, che risale a Humboldt, Sapir, Whorf e altri ricercatori, studia in che 
misura la lingua definisce il comportamento sociale delle persone e le loro forme 
di conoscenza del mondo esterno. Senza soffermarsi su questo, si accennerà al 
ruolo del linguaggio della matematica nello sviluppo della matematica stessa e 
della fisica. 

Il linguaggio delle formule realizza l’esteriorizzazione del pensiero, per cui 
frammenti notevoli del processo mentale possono essere prodotti (e non soltanto 
riprodotti) su supporti esterni dell’informazione, che vanno da un pezzo di carta 
a una lavagna con il gesso, fino ai calcolatori elettronici. E, nei calcoli manuali, 
la scrittura delle formule non compie solo una funzione simile al ruolo della me- 
moria e dell’unità aritmetica dei calcolatori, ma anche quella di unità di control- 
lo (non-deterministica) nei confronti del cervello del matematico. L’aspetto del- 
le formule, la loro struttura e l'analogia con altre formule suggeriscono al ma- 
tematico e al fisico la scelta dell'ulteriore direzione dell’indagine e la scelta della 
nuova semantica per il linguaggio matematico «semanticamente vuoto», 0, piut- 
tosto, «semanticamente polimorfo». La famosa storia dell’«equazione d’onda» 
fornisce di questo fatto illustrazioni stupefacenti. Essa fu ricavata inizialmente 
per descrivere le oscillazioni di una corda, o di una membrana. Maxwell, che la 
ricavò mediante calcoli formali dalle sue equazioni iniziali che collegano le varia- 
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zioni dei campi elettrico e magnetico, dedusse la possibilità della propagazione 
delle onde elettromagnetiche. Note costanti fisiche, presenti nelle equazioni 
di Maxwell, permisero di calcolare la velocità di propagazione di queste onde. 
Poiché essa risultò uguale alla velocità della luce, Maxwell suggeri l’audace con- 
gettura che la luce visibile avesse la stessa natura delle onde elettromagnetiche. 
E le stesse onde e la natura ondulatoria della luce furono poi scoperte speri- 
mentalmente. Schròdinger scrisse la sua equazione d’onda inizialmente nella 
ricerca di un comodo schema matematico per chiarire gli effetti quantistici di- 
screti. Il significato della funzione d’onda, che in quest'equazione appare quale 
incognita, inizialmente non era assolutamente chiaro. La sua successiva inter- 
pretazione quale «onda di probabilità», 0, più esattamente, onda di ampiezza 
(complessa) di probabilità, condusse a introdurre nell’universo dei concetti una 
struttura del tutto nuova e straordinaria, che ha cambiato sia la concezione del 
mondo che il modo di vivere dell’uomo moderno. 

Non è possibile immaginare l’avvento di queste scoperte senza i sistemi sim- 
bolici discreti della scienza. 


3. Modelli matematici complementari. 


Nel $ 1 è stata descritta brevemente una serie di modelli matematici, nei 
quali si considerano le interazioni tra il continuo e il discreto in molteplici si- 
tuazioni fisiche. Oltre ai due casi «puri», tipo varietà differenziale da un lato e in- 
siemi con topologia discreta (solitamente finiti, o numerabili) dall'altro, appa- 
rivano strutture più complesse, dove gl’invarianti discreti si manifestavano come 
provenienti da strutture continue, ad esempio lo spettro di un operatore lineare, 
oppure le caratteristiche topologiche del quadro delle fasi di un sistema dina- 
mico. In questo paragrafo, senza pretendere la completezza, saranno conside- 
rate ancora alcune strutture matematiche che, fino ad ora, hanno trovato rela- 
tivamente poche, o addirittura nessuna applicazione nelle teorie fisiche, ma che, 
è probabile, hanno interesse per il futuro. 

Anzitutto vanno sottolineati due aspetti. 

In primo luogo, nell’ambito della matematica teorico-insiemistica, l'aspetto 
discreto è quello primario; ogni insieme è la collezione dei suoi elementi in nes- 
sun modo legati tra loro, ad eccezione, eventualmente, della relazione d’inclu- 
sione — nell’universo di Zermelo-Fraenkel. L'aspetto della continuità può esse- 
re introdotto in un insieme quale struttura supplementare, individuando una 
classe di insiemi speciali, gli aperti, che definiscono lo spazio topologico. Si 
potrebbero immaginare i fondamenti della matematica con un’altra assiomatica, 
nella quale l'aspetto continuo fosse posto fin dall'inizio. Quale tentativo estre- 
mamente ingenuo si potrebbe, ad esempio, assiomatizzare la relazione «essere 
parte» invece di «essere elemento ». Tuttavia all’autore non sono noti seri lavori 
in questa direzione. L'approccio categoriale ai fondamenti della matematica 
porta in primo piano, evidentemente, le rappresentazioni non connesse diretta- 
mente con la continuità. 
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In secondo luogo tutti i modelli della continuità usati funzionano sostanzial- 
mente con insiemi infiniti, benché la definizione di spazio topologico non richie- 
da che esso sia infinito, ed esistano, infatti, esempi importanti di spazi topologi- 
ci finiti, persino con soli due punti (uno chiuso, l’altro aperto). In fisica appaiono 
solitamente strutture «quasi continue» su insiemi finiti nell’ipotesi che questi 
insiemi siano cosî grandi da poter essere riguardati come se fossero « quasi in- 
finiti». In realtà le risorse matematiche delle teorie moderne sono pit estese. 


3.1. Topologia e tolleranza. 


Spazi non separati. Una proprietà importante della retta R dei numeri reali 
consiste nel fatto che due punti diversi possono essere racchiusi in due inter- 
valli disgiunti. Questa proprietà viene estesa alle varietà topologiche, differenzia- 
bili e analitiche: due punti distinti di una varietà si possono sempre racchiudere 
in due intorni aperti disgiunti. Se uno spazio topologico X gode di queste pro- 
prietà, si dice che per esso vale l’assioma di separazione di Hausdorff. Gli spazi 
(o le topologie) per i (le) quali questo assioma non ha luogo si dicono non-sepa- 
rati. Si riportano alcuni esempi. 

Sia R dotato della topologia nella quale gl’insiemi aperti sono i complementi 
degl’insiemi finiti di punti. Questa topologia non separabile si chiama topologia 
di Zariski su R. Pi in generale, se X è un insieme di numeri complessi, o di 
punti complessi su una varietà algebrica data, ad esempio, da equazioni polino- 
miali in alcune variabili, gl’insiemi aperti in X secondo Zariski sono i comple- 
menti delle sottovarietà algebriche in X. 

La generalizzazione della nozione di varietà algebrica è quella di schema. 
Uno schema è un certo spazio topologico munito di un fascio di anelli. Gli sche- 
mi più semplici sono quelli affini. Se A è un qualsiasi anello commutativo con 
unità, lo spazio topologico dello schema affine Spec A (spettro dell’anello A) con- 
siste in tutti gli ideali primi PCA, cioè di tutti i sottogruppi abeliani di A, chiusi 
rispetto al prodotto con gli elementi di A e tali che, sexye Pconx, ye A, siha xe P, 
oppure ye P. Ogni sottoinsieme EC A definisce il sottoinsieme V(£)C Spec A 
che consiste di quei PCA tali che ECP. I complementi Spec A\ V(E) forma- 
no un sistema d’insiemi aperti in un’opportuna topologia in Spec A che pu- 
re viene chiamata topologia di Zariski. Se A non ha divisori dello zero, due 
qualsiasi insiemi aperti in Spec A, non vuoti, hanno intersezione non vuota, 
cosf che Spec A non è separato. Di più, di regola Spec A contiene punti non 
chiusi, più esattamente, sottoinsiemi non chiusi costituiti da un solo punto. 
Cosf, se A non ha divisori dello zero, {o} è un ideale primo in A e la chiusura 
del punto corrispondente in Spec A coincide con tutto lo spazio. Lo spazio 
Spec A può essere finito, ma dotato di una topologia non-banale come lo spa- 
zio di due punti visto precedentemente. 

Infine si possono ottenere forme diverse di non-separazione «incollando » 
tra loro spazi topologici. Siano X, X' due spazi topologici; UCX, U'CX' sia- 
no due loro sottoinsiemi aperti. Si supponga che esista un omeomorfismo di U 
su U”. Identificando nell’unione XU Xi sottoinsiemi U e U', si ottiene un nuo- 
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vo spazio Y quale risultato dell’incollamento. Se, per esempio, X=X"=R, 
U=U'=R\, {o}, risulta che Y coincide ovunque con R ad eccezione che nello 
o ein Yil punto o diventa «sdoppiato »; due qualsiasi intorni di questi due punti 
in Y si intersecano. 

La non-separazione di due punti x, ye X potrebbe essere riguardata quale 
modello di diversi effetti nelle scienze naturali che fino ad ora non hanno avuto 
una descrizione quantitativa soddisfacente. Per esempio, invece di considerare 
l’elettrone come una formazione puntuale, si potrebbe supporre che i punti 
dello spazio a distanza sufficientemente piccola diventano non-separati in una 
conveniente topologia. La nozione di «distanza minima» potrebbe essere allora 
la caratteristica quantitativa del grado di questa non-separazione rispetto all’or- 
dinaria metrica dello spazio. La stessa cosa si potrebbe fare con un'ipotetica no- 
zione di « durata minima». 

Nelle indagini psicologiche e cosî pure nella teoria delle misurazioni l’aspet- 
to della non-separazione interviene quale conseguenza dell’esistenza di «soglie 
di differenziazione», oppure di «sensibilità degli strumenti». Due punti lumi- 
nosi proiettati su uno stesso fotorecettore dell'occhio diventano indistinguibili. 
Due oggetti materiali, che emettano luce con lungezza d’onda A, diventano in- 
distinguibili quando la distanza tra loro è di un ordine di grandezza minore di }. 

Zeeman, per modellare tali effetti, ha introdotto una nuova nozione mate- 
matica, gli spazi di tolleranza, i quali, a priori, non sono necessariamente dotati 
di una struttura topologica. 


Tolleranza. Sia X un certo insieme. Si chiama tolleranza È su X una rela- 
zione binaria xÉ y che sia riflessiva (xÉx) e simmetrica (da xÉy segue che yÉx). 
Per esempio, si può definire su R (o sul piano R?, o nello spazio R*) una «tolle- 
ranza con distanza minima /» ponendo xÉ y, se la distanza tra x e y non supera /. 

Una delle proprietà interessanti della tolleranza consiste nella possibilità di 
ricostruire una serie di proprietà topologiche di uno spazio a partire dalla stessa 
tolleranza. Grosso modo, se si ha una varietà topologica con una metrica e s’in- 
troduce in essa una tolleranza con lunghezza minima /, le proprietà topologiche 
che «si manifestano a una distanza maggiore di /» possono essere calcolate ri- 
spetto alla tolleranza. Questo fatto è in relazione con il riconoscimento delle « for- 
me » (Gestalt) in psicologia. 

Zeeman ha considerato anche la possibilità di applicare questo schema alla 
descrizione del processo mentale. Euristicamente, si consideri lo spazio Y degli 
stati istantanei di tutti i neuroni del cervello; un punto di Y definisce il carattere 
dell’equilibrio chimico e delle frequenze delle pulsazioni di tutti i neuroni. La 
tolleranza viene definita con la condizione che «due stati corrispondono allo 
stesso pensiero ». La « direzione istantanea » del pensiero è definita da un campo 
vettoriale v su Y; sull’insieme di questi campi è anche definito un concetto di 
tolleranza. Può accadere che le traiettorie di due campi, aventi inizio entrambi 
nei limiti della tolleranza, col tempo escano da questi limiti, come accade nei 
sistemi dinamici non-stabili. Si tratta dell’effetto della non-predicibilità del pen- 
siero. Soprattutto, lo stesso aspetto del campo vettoriale v e la topologia del suo 
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quadro delle fasi variano col tempo e dipendono da eccitazioni esterne, ciò che 
permette di applicare l’ideologia delle catastrofi di Thom (cfr. il $ 1). 

‘l'uttavia, allo stato attuale, il modello di Zeeman non ha raggiunto un livello 
che permetta di dedurre predizioni quantitative atte a verifiche sperimentali. 


Topologie sconnesse. In conclusione ci si soffermerà su una classe di topo- 
logie, ben studiate dai matematici, dove viene meno l’aspetto della connessione 
del continuo indiviso di R. Un sottoinsieme di uno spazio topologico X si dice 
chiuso se il suo complemento è aperto. Uno spazio .X è connesso, se esso non 
è l'unione di due sottoinsiemi chiusi disgiunti. Tali sono tutti gli spazi R”. Ogni 
spazio topologico è l’unione disgiunta di tutti i suoi più grandi sottospazi connes- 
si, cioè di tutte le sue componenti connesse. L’idea intuitiva della connessione è 
strettamente correlata all’idea di continuità e cosi pure alla maggioranza dei 
modelli fisici e ciò per la connessione degli ordinari modelli dello spazio-tempo. 

Si riportano alcuni esempi caratteristici di spazi topologici completamente 
sconnessi, nei quali le componenti connesse sono i singoli punti. L’esempio più 
semplice è lo spazio discreto, nel quale tutti i sottoinsiemi sono aperti (e chiusi). 
Ma la topologia può non essere cosî banale. Sia f un numero primo. Nell’anello 
Z dei numeri interi introduciamo una topologia, dichiarando due numeri interi 
x, y molto vicini se x—y è divisibile per una grande potenza di p. In questa to- 
pologia la somma e il prodotto sono continui, ma essa non è completa; il limite 
di una successione di Cauchy (x), x,—%,-*0 per min (7, m)-+ co, può non esi- 
stere. In modo standard è possibile completare Z in questa topologia e ottenere 
l’anello topologico completo Z, dei numeri interi p-adici. Gli elementi di Z, 
possono essere scritti sottoforma di serie: 


00 
Va,p"  o<a,<p_1. 
n=0 


Le serie finite, per le quali 70 per 12M, sono le rappresentazioni p-arie 
degli ordinari numeri interi. La topologia in Z,, nella quale x, y sono vicini 
quando x—y ha la forma 


co 


I ap" 

n=No 
con 7, grande, si chiama topologia p-adica ed è completamente sconnessa. 

Gli spazi topologici completamente sconnessi racchiudono in sé organica- 

mente l’aspetto della continuità (topologia) e del discreto (assenza di componen- 
ti connesse non-banali). Spazi topologici più generali possono avere componenti 
connesse, sui cui insiemi viene indotta una topologia non-banale, ma completa- 
mente sconnessa. T'ali spazi sono molto importanti nella teoria dei numeri. 


3.2. Invarianti discreti degli spazi topologici. 


Sia X un certo spazio topologico. Il suo invariante discreto più semplice è 
l'insieme delle sue componenti connesse, o il numero di elementi di questo in- 
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sieme, se esso è finito. In topologia algebrica e differenziale si è soliti usare una 
definizione un po’ diversa di componente connessa; i punti x e y appartengono 
a una componente connessa per archi di X, se esiste un’applicazione continua 
f :[0, 1]-+X tale che f(0)=x, f(1)=y, cioè se x e y possono essere uniti con 
un arco (cammino) in X. 

Sia reo (4) l'insieme di tali componenti linearmente connesse di X; si trat- 
ta di quei «pezzi lineari», a due a due disgiunti, l’unione dei quali è uguale a 
tutto X. 

Molti altri invarianti discreti di X possono essere definiti insiemi di compo- 
nenti linearmente connesse di spazi topologici ausiliari che si costruiscono a 
partire da X. Ecco alcuni esempi. 

Sia x, un punto prefissato (detto punto base) dello spazio X. Si chiama spa- 
zio dei cappi, e si indica con Q(X, xo), l'insieme di tutte le applicazioni conti- 
nue f : [o, 1]1-+X con f(0)=f(1)=%y (archi chiusi, o cappi, che cominciano e 
terminano in xy). La topologia in Q(X, xy) s'introduce cosf: se KC{o, 1] è un 
qualsiasi sottoinsieme chiuso e UCX è un qualsiasi sottoinsieme aperto, tutte 
le fe Q(X, x9) con f(K) CU formano un insieme aperto in Q(X, xp) e ogni in- 
sieme aperto è l'unione di una famiglia d’insiemi di quel tipo. 


Gruppo fondamentale dello spazio X. L'insieme 7(X, x9)= To(0(X, Xo)) 
si chiama gruppo fondamentale di X. In esso la legge di composizione, che lo 
trasforma in gruppo, è indotta dall’operazione di composizione dei cappi in 
Q(X, xo); se f. £ : [o, 1] +X sono due cappi, gof è l'unione del cappio f, per- 
corso durante il tempo [o, 1/2] con velocità doppia, e del cappio £, percorso du- 
rante il tempo [1/2, 1] con velocità doppia. L’elemento inverso alla classe f è 
la classe f(1—t). L'elemento identico è è rappresentato dal cappio f(t)=%x, per 
ogni te [o, 1]. Il gruppo ny (X, x) in generale non è abeliano. 

Pertanto il gruppo fondamentale di X definisce la quantità massimale di 
cappi con i quali si può «avvolgere» X, a meno di deformazioni di un cappio 
in un altro. Per esempio, il gruppo fondamentale di una circonferenza è Z; al 
numero 7#:>o corrisponde un cappio che corre attorno alla circonferenza m 
volte in una certa direzione, mentre al numero —m corrisponde lo stesso cappio 
nella direzione contraria. 

Sia dato, per esempio, nel dominio (0, o)e UCR? del piano un campo vetto- 
riale liscio f : U+R? avente un punto stazionario isolato in (0, o). Allora la 
funzione f(x)=f(x)/IIf(&)| (|ly|| è la lunghezza del vettore y) definisce un’ap- 
plicazione di un piccolo cerchio in U con centro (0, 0) sul cerchio unitario S1 e, 
con ciò stesso, un elemento del gruppo 7t;(.S*, x0) (qui la scelta di xy S! non 
è essenziale). Nell’identificazione x, (53, x) = Z, che richiede la scelta di un’o- 
rientazione di S!, ad esempio il verso orario quale verso positivo, all’applicazio- 
ne sopra descritta corrisponde un numero intero ?(f), detto indice, o numero di 
rotazioni del campo f nel punto corrispondente. Se il campo f corrisponde al 
quadro delle fasi di un sistema, i(f) è un importante invariante discreto dello 
stato stazionario corrispondente. 

Se X è una varietà differenziabile a due dimensioni compatta (da ogni suo 
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ricoprimento se ne può estrarre uno finito), la somma degl’indici dei punti sta- 
zionari di un qualsiasi campo vettoriale su X non dipende dal campo. Questa 
somma è un invariante discreto di X; è la sua caratteristica di Eulero y(X). Da 
qui segue che, se y(X)30, ogni campo vettoriale su X ha punti stazionari. 
Questo risultato si può riguardare come il fatto più semplice della teoria quali- 
tativa delle equazioni differenziali, che mostra l’importanza degl’invarianti to- 
pologici discreti dello spazio delle fasi. Esso è applicabile, per esempio, alla 
sfera a due dimensioni S?: y(52)=2. 


Superfici compatte orientate. ‘Una varietà differenziabile X si dice orienta- 
bile se in essa vi è un atlante tale che gli jacobiani delle matrici delle funzioni 
di passaggio da una carta all’altra hanno tutti uno stesso segno. Un esempio di 
varietà non orientabile è il nastro di Mòbius. Una varietà orientabile compatta 
X a due dimensioni è completamente definita, a meno di un omeomorfismo, 
dal suo gruppo fondamentale. Più esattamente, si consideri il gruppo quoziente 
abeliano massimo di T(A ). È noto che esso è isomorfo a Z?9, dove gzo è un 
numero intero. Per ogni g esiste una superficie compatta orientabile unica, a 
meno di omeomorfismo, con il gruppo corrispondente; essa si dice superficie 
di genere g. Perg=o si ottiene la sfera; per g= 1 il toro; per tuttiig=1 si può 
immaginare questa superficie come la sfera S? alla quale siano stati incollati g 
«manici», Incollare un manico significa ritagliare sulla sfera due piccoli fori ro- 
tondi e unire poi i loro bordi per mezzo di una superficie cilindrica. 

In particolare, se il genere di X è uguale a g, si ha y(X)=2— 2g. Pertanto 
su ogni X, ad eccezione del toro, i campi vettoriali hanno punti stazionari. 


Gruppi superiori di omotopia. Come sopra, X sia uno spazio topologico e 
si assuma ax come punto base. Per ogni n= 1 sia Q"+1(X, x) = Q(Q2"2(X, x0), 
80), dove #=% € #1! sono i cappi costanti: f(t) = &? per ogni te [o, 1]. L’in- 
sieme rto(0"(X, xo), #2), nel quale pure in modo naturale s’introduce la strut- 
tura di gruppo (per 2>2 esso è necessariamente abeliano), si chiama n-esimo 
gruppo di omotopia dello spazio X e si indica con x,(X, x). Questo gruppo si 
può pure interpretare quale gruppo delle classi dei «cappi ad x dimensioni» 
dello spazio X, cioè quale gruppo delle classi linearmente connesse delle appli- 
cazioni (5%, s9) > (X, xo), dove 5, € 5% è un punto base sulla sfera 5% ad x dimen- 
sioni data in R"#! dall’equazione yî+...+y3,,=1. 

Più in generale, si può considerare la categoria degli spazi topologici, ognuno 
con un punto base, e dei morfismi, che sono classi di omotopia di applicazioni 
di questi spazi che applicano ogni punto base in un altro. Sia IT(X, Y) l'insieme 
dei morfismi dell’oggetto X nell’oggetto Y in questa categoria. Allora 1,(X, xo) 
può essere identificato con II (($5”, 50), (X, x0)) e la corrispondenza X+r,(X, 
Xo) è un funtore rappresentabile mediante l'oggetto (S", so). Scegliendo altri 
oggetti in questa categoria si possono ottenere altri importanti funtori; ; per esem- 
pio, i gruppi di coomologia. Per ogni gruppo abeliano G e per ogni numero 
intero 22.1, si può costruire lo spazio K(G, n), con un punto base, tale che 
II (X, K(G, n)) è il gruppo H*(X, G) di coomologia a n dimensioni dello spa- 
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zio X con G quale gruppo dei coefficienti. Nel caso di G=Z e di X varietà 
differenziabile compatta, questi gruppi sono abeliani e hanno un numero finito 
di generatori. Il rango C,(X) di questi gruppi è un importante invariante nu- 
merico intero dello spazio X. Un altro invariante è la torsione di #*(X, G), 
cioè le caratteristiche numeriche del gruppo degli elementi di ordine finito. 

I gruppi H?(X, G) e loro generalizzazioni hanno già cominciato a trovare 
applicazioni in fisica nello studio delle singolarità degl’integrali di Feynmann. 
È questo un esempio di come, a un livello di astrazione matematica molto alto, 
appaiano caratteristiche discrete a partire da modelli continui. [JU. 1. M.]. 


Griinbaum, A. 
1967 Modern Science and Zeno’s Paradoxes, Wesleyan University Press, Middletown Conn. 
Neumann, J. von | 
1958 The Computer and the Brain, Yale University Press, New Haven Conn. (trad. it. in 
V. Somenzi (a cura di), La filosofia degli automi, Boringhieri, Torino 1965, pp. 157- 
221). 
Thom, R. 
1971  Stabilité structurelle et morphogénèse. Essai d’une théorie générale des modèles, Benjamin, 
Reading Mass. 


Dotata di una caratterizzazione gnoseologica molto generale, la categoria (cfr. cate- 
gorie/categorizzazione) continuo/discreto si presenta in molti campi. La fisica, pur 
incompleta nelle sue conoscenze, si sforza di dare una visione universale della natura, 
fondendo l’aspetto quantistico (cfr. quanti) del micromondo, dominato dalla probabilità 
e dalla discontinuità, con il quadro geometrizzato dello spazio/tempo macroscopico, in- 
centrato invece sulla continuità. 

La descrizione dei modelli del mondo osservato, demandata all’elaborazione di mo- 
delli matematico-fisici (cfr. modello, struttura, matematiche, assioma/postulato), 
pone in evidenza vari livelli gerarchici dimensionali, partendo dalla strutturazione ato- 
mistica (cfr. atomo e molecola) della materia e dalla distribuzione energetica (cfr. 
energia) delle varie particelle (cfr. particella), per arrivare ai modelli della macrofisica, 
interpretati alla luce della teoria della relatività e della meccanica statistica dell’equili- 
brio e del non-equilibrio (cfr. equilibrio/squilibrio), e coinvolgenti anche i concetti di 
moto e forza. 

Il continuo/discreto, oltre a presentarsi nei processi di regolazione degli organismi 
viventi (cfr. organismo), costituiti dal sistema nervoso (cfr. cervello) e endocrino (cfr. 
integrazione), svolge un ruolo importante nei processi di codificazione, trasmissione (cfr. 
codice, comunicazione) ed elaborazione dell’informazione ereditaria (cfr. eredità) 
degli individui, che ne assicurano lo sviluppo (cfr. sviluppo e morfogenesi) e la riprodu- 
zione, consentono il manifestarsi dei caratteri visibili (cfr. gene e genotipo/fenotipo) e, 
grazie all’intervento dei meccanismi di mutazione/selezione naturale, portano all’evo- 
luzione del mondo vivente sul nostro pianeta. I problemi connessi alla trasmissione delle 
informazioni hanno acquistato grande rilevanza in seguito alla comparsa dei calcolatori 
(cfr. analogico/digitale e macchina), capaci di eseguire qualsiasi algoritmo (cfr. ap- 
plicazioni). 
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I. Principî generali. 


Tutti i modelli scientifici dipendono dalla considerazione di una serie di 
limitazioni: alcune sfere di fatti, di fenomeni, di relazioni sono prese in esame 
e vengono interpretate, altre vengono considerate non essenziali, almeno in 
un primo momento. Ciò è condizionato, in primo luogo, dalle limitate pos- 
sibilità che il cervello ha di elaborare le informazioni. La coscienza, una volta 
abbracciate tutte le cause e tutti gli effetti possibili, vive in un mondo del tutto 
illusorio. 

Un altro fattore fondamentale è il carattere sociale della scienza, in quanto 
suo materiale grezzo possono essere soltanto fenomeni riproducibili in un 
senso o in un altro, e pertanto soggetti alla socializzazione. Tuttavia, un’esatta 
riproducibilità è impossibile, conformemente alla vecchia metafora di Eracli- 
to sul fluire del tempo. Le leggi della meccanica quantistica che postulano il 
carattere essenzialmente statistico della natura, conferiscono a questa metafora 
una capacità ulteriore di persuasione. Una riproducibilità approssimativa pre- 
suppone che si trascurino molti fattori. 

Nell'ambito di ciascun modello teorico, viene quindi postulato che le ca- 
ratteristiche esaminate al suo interno siano totalmente indipendenti da tutte 
quelle in esso trascurate. Le stesse caratteristiche esaminate sono fra loro 
collegate in un sistema di relazioni, che costituiscono anche l'essenza del 
modello (insieme alle regole semantiche e operative d’interpretazione). Il pas- 
saggio a un altro modello fa mutare sia il sistema delle caratteristiche, sia i 
rapporti di dipendenzafindipendenza tra di esse. Questi ultimi hanno perciò 
un carattere relativo. 

Si cita come semplice esempio il modello classico di Galileo : la caduta libera 
di un grave da un’altezza % alla superficie terrestre. Il tempo di caduta £ è 
collegato con % dalla relazione funzionale V2h/g=t, dove g è il coefficiente 
«accelerazione di gravità». In questo modello il tempo di caduta non dipende 
dalla forma e dal peso del corpo, in quanto non si tiene conto della resistenza 
dell’aria. Tale dipendenza può essere presa in considerazione in un modello 
appena più accurato, ma è probabile che verrà implicitamente ammessa l’indi- 
pendenza del tempo di caduta dalla posizione della Luna. Eppure quest’ultima 
fa variare il potenziale gravitazionale sulla superficie della Terra ed è un fattore 
determinante per un qualsiasi modello delle maree. 

In questo articolo si adotterà quindi la seguente concezione. Le nozioni 
di dipendenzafindipendenza vanno annoverate fra le idee metateoretiche più 
generali, con un amplissimo spettro di realizzazioni concrete. La compilazione 
dell'intero catalogo di questi significati concreti equivale all’esame dettagliato 
di tutti i modelli scientifici attualmente conosciuti: il compito, naturalmente, 
è irrealizzabile. Quello che ci sforziamo di fare è isolare un certo nucleo di 


Dipendenza/indipendenza 852 


concetti, strettamente collegati alla descrizione della coppia dipendenza/indi- 
pendenza, all’interno di alcuni modelli fondamentali della fisica teorica. Alla 
fine dell’articolo sarà brevemente esaminata la loro applicazione a problemi non 
appartenenti al campo della fisica. se n. 

La fisica teorica utilizza la matematica quale linguaggio di lavoro: il pro- 
blema che ci si è posto richiede proprio un'analisi degli strumenti matematici 
che esprimono i concetti di dipendenza/indipendenza, seppure nella loro cor- 
relazione con la semantica dei vari modelli. Quest'ultima proprietà del resto 
è fondamentale, dal momento che le stesse parole ‘dipendenzafindipendenza 
vengono usate in modo abbastanza limitato come termini matematici di uso 
corrente. | i. 

Essi vengono utilizzati in analisi e in algebra (dipendenza lineare, algebri- 
ca, funzionale), nel calcolo delle probabilità (variabili aleatorie indipendenti) e, 
infine, nella logica matematica (indipendenza di una data asserzione, in un 
linguaggio formale, da un dato sistema di assiomi). l i 

È indubbio che l’idea di dipendenza funzionale sia uno degli strumenti 
principali nella descrizione matematica delle relazioni nei modelli sont: 
Il $2 sarà interamente dedicato alla descrizione dei contesti matematici nei 
quali s'incontrano le parole che dànno il titolo a. questo articolo. Tuttavia, 
l’interpretazione data all'argomento dell’articolo lo riconduce all'aspetto «rea- 
listico» della semantica della matematica. Questo significa che il concetto di 
dipendenzafindipendenza può esser espresso virtualmente da qualunque con- 
cetto matematico in un modello adeguato. Sembra molto istruttivo l'esame di 
quali sono precisamente i concetti che trovano una reale utilizzazione. 23 
questo motivo nell’articolo figurano, ad esempio, i prodotti tensoriali degli 
spazi di Hilbert, poiché essi compaiono nella descrizione dell'unione dd 
sistemi quantistici. Le particolari «interazioni» di particelle indistinguibili Di 
gas di Fermi o in quello di Bose norì possono essere esattamente descritte sc 
non dai mezzi dell’algebra multilineare. L'idea di « causalità », una delle nozioni 
centrali nel paradigma dei concetti fisici legati a dipendenzafindipendenza, 
conduce, attraverso la trasformazione di Fourier, alle funzioni analitiche e 
alla tecnica delle «relazioni di dispersione». L'idea di «informazione» in un 
sistema complesso, per esempio un organismo biologico, sembra SE 
collegata ai concetti matematici di equilibrio/squilibrio, e alle concezioni della 
teoria delle catastrofi di René Thom. L'idea dei vincoli imposti a un dato 
sistema dal mondo esterno e del carattere locale delle interazioni fra le «parti» 
del sistema è espressa in termini di geometria differenziale. È possibile molti 
plicare il numero di questi esempi; l’analisi di alcuni di essi costituisce 1 argo 
mento del $ 3. La successione dei temi di questo articolo sviluppa le cor di 
spondenti argomentazioni dell’articolo «Applicazioni» di questa stessa Enc 
clopedia. 
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2.  Dipendenzafindipendenza come termini matematici. 


2.1. Relazioni nella teoria degli insiemi. 


Il più comune modello di dipendenza nell’ambito della teoria degli insiemi 
è descritto dalla struttura formata da n insiemi Xi, «.. X, e dal sottoinsieme 
MEX, X...XXn, detto relazione n-aria tra gli insiemi. Ad esempio, X; può 
essere l’insieme dei valori a priori ammissibili per una qualche caratteristica, 
o parametro, del fenomeno osservato. Se tutte le n caratteristiche considerate 
non sono legate l’una con l’altra in alcun modo, allora il «vettore » Kx%1) +01 Xn) 
dei loro valori simultanei può essere un qualunque elemento di X, x...x.X 
Se invece tra le caratteristiche si hanno certe connessioni, allora x, +01, Xp) 
può trovarsi soltanto in un qualche sottoinsieme M CX X.. XX, che esprime 
tali connessioni. In questo schema s’inquadra la procedura sperimentale tipo 
della presentazione dei risultati di misurazioni congiunte di alcune variabili, 
sotto forma di punti su un grafico: ciò corrisponde al caso X,=X3=R (0 
alcuni sottoinsiemi di R; qui è sottintesa la scelta preliminare delle unità di 
misura, che permettono di descrivere i valori delle caratteristiche mediante 
numeri reali). L'insieme delle coppie dei valori osservati {x,, x») ha di solito 
l'aspetto di una certa «nube di punti», la cui forma determina le caratteristiche 
generali della futura descrizione MM del modello teorico idealizzato. Questo è 
il modello di partenza per l’«analisi fattoriale » nelle scienze sociali e biologiche. 

Si consideri un sistema meccanico: la sua posizione istantanea può essere 
individuata mediante le coordinate cartesiane di un numero finito di punti 
distinti (ad esempio, tre punti per un corpo rigido), cioè mediante un punto 
opportuno nello spazio coordinato a più dimensioni RN. Non è detto però 
che ogni punto di RN corrisponda realmente ad una posizione ammissibile. 
L'insieme di queste ultime MC RY è lo spazio delle configurazioni del sistema 
meccanico, e l’enunciazione delle sue proprietà individua i «vincoli». Ad esem- 
pio, per un corpo rigido l’insieme Mc R? è caratterizzato dalle condizioni 


M= {() 


dove x;, è la k-esima coordinata dello i-esimo punto, r;; è la distanza fra lo 
i-esimo e lo j-esimo punto. 


3 
prat; i,j=1,2, s} 


2.2. Funzioni. 


La relazione MCXxY è chiamata grafico di una funzione, o di una tra- 
sformazione, da X a Y, se verifica la seguente condizione: per ogni xe X 
esiste un unico elemento ye Y per cui ‘x, y) e M. Le relazioni funzionali sono 
particolarmente forti: l'affermazione secondo cui il valore della caratteristica 
y di un dato fenomeno è completamente determinato dai valori della caratte- 
ristica x, insieme alla esplicita descrizione di questa dipendenza, rappresenta 
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la formulazione generale di molte leggi delle scienze naturali. Le proprietà 
generali delle funzioni e una serie di modelli che utilizzano dipendenze fun- 
zionali sono state descritte nell’articolo « Applicazioni». Si ritornerà più avanti 
sugli aspetti specifici delle dipendenze funzionali importanti per il tema svolto 
in questa sede. 


2.3. La dipendenza in algebra. 


Si riportano alcuni esempi caratteristici dell’uso del termine ‘dipendenza’ 
in ambiti algebrici. Lo schema generale è il seguente: in Xu n Xa sono a8- 
segnate alcune leggi di composizione; con il loro aiuto è costruita la famiglia 
di trasformazioni f; : X,Xx...XX,>Y,, agli insiemi Y; appartengono determi- 
nati elementi y,€ Y;; la dipendenza di un dato tipo è determinata dalla rela- 


zione R= Ufj!(y;). Ecco i principali casi particolari. 
E 


Dipendenza lineare. Gli elementi x;, ..., x, di uno spazio vettoriale X sul 
campo È sono detti linearmente dipendenti se esistono elementi del campo 


n 

a,, ».., a ,€k, non tutti nulli, tali che Vaz;=o0. Altrimenti, x, ...,%, SONO 
i=1 : " Li 

linearmente indipendenti: ciò significa che dall’uguaglianza Lno segue 


= 
che tutti gli a; sono nulli. La riformulazione nei termini dello schema sopra 
descritto è la seguente: la famiglia di trasformazioni FIXX..XKX>X si one 
pone di trasformazioni lineari non nulle del tipo f(x, ..., xp) =} 4;% ah; 
le relazioni di dipendenza lineare MCX x... x .X sono Uf(0). In seguito, 


ovviamente, non si ridurranno a questo schema le definizioni formulate in mo- 
do abituale. l Led 

Il numero massimo dei vettori linearmente indipendenti nello spazio è 
detto dimensione dello spazio vettoriale X (la dimensione è infinita se tale 
numero non è finito). Questo è l’esempio più semplice d’invariante discreto 
di una struttura matematica, descritto in termini di dipendenza. Le sue diverse 
varianti, anche in casi non-lineari, sono dette dimensione, rango, ecc. 

La dimensione dello spazio fisico è uguale a tre, quella dello spazio-tempo 
è uguale a quattro. Ciò significa che per la perfetta localizzazione di un evento 
elementare, accaduto in un punto dello spazio-tempo, sono sufficienti quattro 
numeri reali: tale condizione comporta fortissime limitazioni sulla forma delle 
leggi della natura. © A . 

Si supponga che in uno spazio lineare di dimensione finita Xx sia scelta a 
base, cioè X s’identifichi con lo spazio &" delle m-ple di elementi del campo i 
Allora si applica il seguente metodo per stabilire la dipendenza O) I indipendenza 
lineare di n vettori assegnati x1, ..., xy€-X. Si scrivano le coordinate di questi 
vettori come righe di una matrice (con x righe e m colonne). Se n>m, i vettori 
x*]; -.+,%, sono linearmente dipendenti. Se ns<m i vettori sono linearmente 
indipendenti se, e solo se, tale matrice A contiene una sottomatrice di dimen 
sione n x n formata da x colonne della matrice A, il cui determinante («minore » 
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di A) è diverso da zero. Si ricordi che il determinante det (a;;) di una matrice 
quadrata su è l’espressione Ve(sa,sn-Ans(m dove s descrive tutte le per- 


g 
mutazioni dell'insieme (1, ..., n), e e(s)=+1 è il segno della permutazione s. 
Si osservi che per &=R, qualora lo spazio R” sia munito della solita struttura 
euclidea, il determinante della matrice n x n è uguale al volume orientato del 


parallelepipedo E d;%; 


O<A%;< i, sotteso dai vettori riga di questa matrice. 
«1 


Spesso la definizione di dipendenza lineare è espressa nella seguente for- 


ma non-simmetrica: il vettore x, è detto linearmente dipendente dai vettori 
nel - 
Xp +»: Xn-1 Se esiste una relazione del tipo x,= Y a;x;, a;ck, oppure, il che 
n w@=1 
è lo stesso, una relazione del tipo xv a;X;=0 Con 4,60. 
si 


Dipendenza algebrica e funzionale. Sia K un certo campo, e &RCK un certo 
suo sottocampo. Gli elementi x;, ..., x,€ XK sono detti algebricamente dipen- 
denti su & se esiste un polinomio non identicamente nullo Fe& [T,, Tal 
con coefficienti in £ tale che F(x,, ..., x,)=0 nel campo K. 

Il numero massimo di elementi algebricamente indipendenti del campo K 
su À è detto grado di trascendenza di X su &. Sia ad esempio .X una varietà 
compatta complessa, sulla quale le funzioni meromorfe formano il campo K. 
X può essere ad esempio una varietà proiettiva algebrica irriducibile. Allora 
il grado di trascendenza di X sui numeri complessi C non è superiore a, e 
nel caso algebrico coincide con, la dimensione x della varietà X concepita nel 
seguente modo: quasi tutti i punti di X possiedono un intorno analiticamente 
isomorfo a C”. 

Per ogni campo È esiste un’estensione massimale 7>k, avente su k un grado 
di trascendenza nullo. Essa è univocamente definita a meno di un isomorfismo 
su È, e è detta completamento algebrico di &. Tutti i suoi elementi si ottengono 
come radici di polinomi non identicamente nulli in una variabile con coefficienti 
in k. Il completamento algebrico del campo dei numeri razionali Q può essere 
realizzato come il sottocampo dei numeri complessi C, formato da tutti i nu- 
meri algebrici Q. Tuttavia, il grado di trascendenza di C su Q è infinito. 


Il concetto di dipendenza algebrica comporta una serie di utili varianti. 
Per la teoria dei numeri e per la geometria algebrica è importante il seguente 
concetto di dipendenza intera. Siano Ac B due anelli commutativi con unità. 
L'elemento xe B è detto intero su A se soddisfa l'equazione F(x)=0, dove 


.Fe A[T]è un polinomio con coefficienti in A e il cui coefficiente della potenza 


di grado massimo è l’unità. 

Per la teoria delle funzioni e per la geometria differenziale e analitica è im- 
portante il concetto di dipendenza delle funzioni che ha il seguente significato. 
Siano f(x), ..., fn(*) funzioni definite sulla varietà X. Se esse verificano una 
relazione del tipo F(f,, ..., f,)=0, allora sono dette dipendenti. Imponendo 
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a f e soprattutto a F la condizione di appartenenza all’una o all’altra ce di 
funzioni, se ne ricavano i concetti di dipendenza algebrica, analitica, ineare, 
e cost via. Se fi, ..., f,, sono funzioni differenziabili di n variabili reali su o 
vale il seguente importante criterio di assenza di qualsiasi Sar non ca ; 
F(f,; +.f,)==0 con la funzione differenziabile F. Tale criterio a 2 che 
determinante della matrice (òf;/dx;), il cosiddetto Jacobiano, risulta. iverso 
da zero in un certo punto. Ciò significa che, se le funzioni fp con un'appros- 
simazione lineare vicino ad un certo punto, sono linearmente indipendenti, 
allora esse sono anche funzionalmente indipendenti. o. | 

Qualsiasi funzione regolare, definita su una varietà differenziabile DÈ 
sionale, dipende in modo regolare dalle x funzioni coordinate. In questo modo, 
la dimensione geometrica assume un aspetto funzionale, essendo espressa me- 
diante il numero massimo possibile di funzioni indipendenti. Questo stesso 
schema è usato nella geometria algebrica ed analitica. 


Moduli e gruppi abeliani. Sia M un modulo su un anello A. Gli elementi 
%; +++ xy €M sono detti indipendenti se dalla relazione 
$ a;X;= 0 
w=1 . 
con a,e A segue che tutti gli a, sono uguali a zero. Questa definizione ripete 
testualmente quella di dipendenza lineare negli spazi vettoriali. lea na 
paiono nuovi importanti fenomeni se l'anello A non è un campo, dal ad o 
che non tutti i moduli (neppure in condizioni di finitezza) sono isomor i 
modulo delle n-ple 4”, n>o. Ad esempio, nel modulo Z/mZ ai 3 
numeri interi (m.40 numero intero) qualsiasi famiglia di elementi è ur " o, 
comprese tutte le famiglie ad un solo elemento {x}. I moduli, isomor È ; 
sono detti liberi di rango n, e uno strumento potente d'indagine di un qualunque 
modulo consiste nel confrontarlo con i moduli liberi. ata, i 
Se si suppone che M sia finitamente generato, ciò significa che esiste ui 
omomorfismo suriettivo 4% + M. Con M, è designato il suo nucleo. Esso può 
non essere finitamente generato, ma lo è nell’importante classe degli anelli 


fa 
; RE i _ 
noetheriani. Si può allora definire un omomorfismo suriettivo A» —+ Mi, wo 
gliendo i generatori di M,. Si può quindi applicare questo procedimento a 
nucleo MM, dell’omomorfismo fp, e cosf via. Si ottiene in tal modo la successio- 
ne di moduli e di omomorfismi 


i 7, f 
+ Ai fi, Aqua di Av 4 M—-o 


successione esatta. | me 
di ose del nucleo di f, possono essere interpretati come Da 
lineari, o sizigie, fra i generatori del modulo M scelti per la costruzione x È 
l'’omomorfismo fi; gli elementi del nucleo di fi possono essere interpre si 
come relazioni fra queste relazioni, e via dicendo. Fu Hilbert a studiare De fi 
prima volta una tale successione di sizigie 0, per dirla in termini mo o ni, 
una tale risoluzione del modulo M; egli dimostrò il teorema fondamentale in 
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base al quale essa, per l’anello dei polinomi &[7,, ..., 7,] in # variabili su un 
campo, termina in 7 passi, nel senso che il nucleo În Sarà certamente un modulo 
libero. Con questo teorema Hilbert ha posto la base della moderna algebra 
omologica, il cui problema tipico consiste nello studio di quegli invarianti del 
modulo M che è possibile ricavare dall'esame di una sua qualunque risoluzione 
libera. In particolare, la lunghezza di tale risoluzione è una caratteristica tipica 
della dimensione (dell’anello e del modulo). Il termine ‘sizigie’ per le relazioni 
lineari risale al linguaggio degli astronomi: i rapporti numerici tra i periodi di 
rivoluzione dei pianeti conducono al ripetersi regolare delle configurazioni del- 
le loro mutue posizioni, ad esempio le opposizioni. 

I moduli sull’anello Z sono semplicemente dei gruppi abeliani. Ogni gruppo 
abeliano G, nella notazione additiva, ammette una risoluzione (complesso 
esatto) del tipo 0+Z"+Z" + Go. Il numero m-—n non dipende dalla scelta 
della risoluzione e si chiama il rango r del gruppo G. Un gruppo di rango r 
è isomorfo alla somma diretta Z®G,, dove Gy è finito. In un gruppo di rango 
r esiste un sistema di r elementi indipendenti, ma +1 elementi arbitrari sono 
già dipendenti. 

È conveniente descrivere il concetto fondamentale di « dimensione (scalare) 
di una grandezza fisica», in termini di dipendenza e di rango di un gruppo 
abeliano, 1 

In un qualunque modello fisico figurano concetti tipo tempo, lunghezza, 
massa; forza, lavoro e potenza; carica elettrica, ecc. 

La loro introduzione è accompagnata dalla descrizione di procedure speri- 
mentali per la scelta di unità di misura e per l’espressione numerica delle 
corrispondenti caratteristiche del sistema in termini del dato sistema di unità. 
In ogni modello alcune unità vengono considerate fondamentali e indipen- 
denti, altre invece derivate da queste. È molto naturale considerare le unità 
derivate come elementi del gruppo abeliano libero generato dalle unità fon- 
damentali. Cosi nella fisica newtoniana le unità di lunghezza L, di tempo 7 e 
di massa M sono considerate le unità fondamentali. Allora le unità di velocità 
LT, di forza MLT? e di lavoro ML?T-? sono considerate derivate {come è 
usuale, le si scrive con notazione moltiplicativa; cfr. le notazioni più classiche 
del tipo cm/sec per la velocità). Un elemento del gruppo abeliano libero, ge- 
nerato dalle unità fondamentali, corrisponde a una data grandezza fisica e si 
chiama dimensione di questa grandezza. È naturale ritenere che il gruppo di- 
mensionale stesso D non dipenda dalla scelta delle unità: l'elemento L corri- 
sponde alla lunghezza indipendentemente dalla convenzione usata per la scelta 
dell’unità di lunghezza. 

Il gruppo dimensionale D è una caratteristica molto importante del modello 
fisico. Lo sviluppo delle scienze naturali è stato accompagnato da due processi 
opposti che hanno cambiato d'improvviso la nostra concezione della natura: 
da una parte l'ampliamento del gruppo D relativo ai modelli fondamentali, 
in connessione con la scoperta di variabili di nuova natura, dall’altra la riduzione 
di questo gruppo in connessione con la scoperta di relazioni tra le dimensioni 
che prima erano considerate indipendenti. 
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x 


Cosî, la prima indagine sulla natura dell’elettricità è stata accompagnata 
dall’aggiunta, alle unità L, 7, M, dell’unità q di carica elettrica (nel sistema 
moderno ccse la carica elementare dell’elettrone è uguale a 4,80-10-1° u. e. s.). 
D'altra parte, l’accettare l’idea della costanza della velocità della luce nei siste- 
mi inerziali conduce, nella teoria della relatività speciale, al legame L= 7" nel 
gruppo corrispondente D: ogni scelta dell’unità di lunghezza permette di as- 
sumere, come unità di tempo, il tempo necessario alla luce per percorrere ta- 
le unità di lunghezza. (Per la misura delle distanze cosmiche ci si serve del- 
l’unità «anno-luce »; in tale definizione, ovviamente, è utilizzata Ja procedura 
inversa della determinazione della lunghezza attraverso il tempo). 

Ogni scoperta di un’unità naturale di misura per questa o quella grandezza 
fisica conduce perciò alla scoperta di una nuova relazione nel gruppo D usato 
in precedenza, e alla sua sostituzione con il gruppo quoziente corrispondente a 
questa relazione. La costante gravitazionale di Newton G, la velocità della 
luce c, la costante di Planck # (che fornisce l’unità universale per l’azione) e la 
carica dell'elettrone e rappresentano le grandi svolte di questo cammino. Nel 
1899 Planck poté indicare il sistema universale di unità fondamentali 


L* =(5G/3y2= 1,6-10-?° cm 
T*=(G|[c8)!/2= 5,3-1074 sec 
M*=(fic[G)!? =2,2-1075 g 


che riducono il gruppo D a uno banale e permettono di considerare tutte le 
grandezze della fisica come costanti adimensionali. È degno di nota che le 
espressioni costruite indipendentemente dalle unità fondamentali (compresa 
la carica dell'elettrone) hanno la stessa dimensione anche in un gruppo più 
grande, cosicché i loro rapporti sono sempre costanti numeriche universali. 
La più famosa di esse è la costante di struttura fine e?/fic: la velocità media 
dell’elettrone nell’atomo dell’idrogeno è grosso modo pari a 1/137 (della velo- 
cità della luce). Attualmente questo numero viene determinato con grande 
esattezza in modo sperimentale. La scoperta di un modello teorico, in cui il 
suo significato potrebbe risultare derivato da principî fondamentali, è consi- 
derata uno dei più interessanti compiti della microfisica. 

La considerazione del gruppo D per un arbitrario modello fisico pone 
notevoli limitazioni alla forma matematica delle relazioni in questo modello: 
ogni relazione rappresentata, ad esempio, da un rapporto di polinomi fra i 
parametri, deve essere omogenea, cioè tutti i monomi devono avere la stessa 
dimensione (tenendo conto della dimensione delle costanti). Im espressioni 
tipo exp gp, g deve essere «adimensionale». Ad esempio, nella formulazione 
della meccanica quantistica di Feynmann figura l’espressione exp(iS/#) dove 
S è un’azione classica; evidentemente, essendo .S/f una grandezza adimensio- 
nale, l’azione è misurabile in unità universali di Planck. 

Le considerazioni di dimensionalità a volte limitano talmente la forma delle 
relazioni possibili da permettere di determinarle in modo quasi univoco. Esse 
sono anche largamente usate nella costruzione di modelli sperimentali, ad 
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esempio nell’idrodinamica per determinare i coefficienti di similitudine con 
l’aiuto dei quali sono ricalcolate le misurazioni dei modelli per ottenere le 
informazioni sui fenomeni in tempo reale. 

L'esistenza di unità universali di misura è strettamente legata all’inesplica- 
bile fatto dell’indistinguibilità delle particelle elementari di un tipo, ad esempio, 
di elettroni. Come mostreremo pit avanti, lo stesso fatto di questa indistin- 
guibilità, insieme ai fondamenti quanto-meccanici della descrizione dei sistemi 
di particelle, conduce ad effetti molto peculiari delle interazioni, che non pos- 
sono essere spiegati sulla base delle idee classiche relative alle «forze», ad 
esempio, di attrazione o di repulsione. 

Il seguente esempio curioso è ripreso da Weisskopf [1970]: «L'altezza delle 
montagne è determinata da costanti fisiche fondamentali». Si tenga presente 
quanto segue: la cima più alta della Terra, l’Everest, ha un'altezza di circa 
ro km; perché non ci sono montagne pit alte? Anche senza tener conto dei 
meccanismi di distruzione e di erosione geologica, si dimostra che la natura 
fisica della materia solida delle rocce della Terra, le dimensioni della Terra e 
i valori delle costanti fondamentali limitano la possibile altezza nell’ordine di 
alcune decine di chilometri. Una montagna di massa M e di altezza % può 
avere il peso MMG con il risultato di «fondersi» o di «liquefarsi » nella sua parte 
inferiore fino ad un’altezza x. L’energia di fusione, in questo modo, determina 
un'altezza massima fino alla quale non ha ancora luogo la fusione. Tenendo 
conto dell’ordine delle grandezze corrispondenti, si ottiene la disuguaglianza 


h _ a 1 1 
an 8g NA 455 


dove ay è il raggio dell’atomo dell'idrogeno, ag = Gmi/fic> 5,9-10799 (m, è la 
massa del protone), a=e2/fic=1/137 è la costante di struttura fine, Azbo 
è il peso atomico medio della materia della montagna, N-3-105! è il numero 
dei protoni e dei neutroni nella materia della Terra, B--0,1, n0,2 sono le 
caratteristiche del calore di fusione. 


La dipendenza nei gruppi non-commutativi. Siano G un gruppo non ne- 
cessariamente commutativo e x,, ..., x,, suoi elementi. Essi sono detti dipen- 
denti, se esiste un’espressione non banale uguale all'unità del tipo xf1xs2,.xîm = 
SI Qui a; {1, ..., n}, &;= +1, e la non-banalità significa che non esiste un 
indice î per cui 4;=@;,, € €;= — €;11, Cioè non si possono ridurre le molti- 
plicazioni presenti. Una definizione più invariante è la seguente. Per ogni 
numero intero n2>1 è possibile determinare un gruppo libero G, di rango x 
con generatori liberi {y,, ...,y,}. Questo gruppo è definito completamente dal 
fatto che un qualunque omomorfismo G,,+G in un qualunque gruppo G è 
definito univocamente da f(y;), ..., f(y,) ed è possibile scegliere queste im- 
magini arbitrariamente. Se f(y;)=x;, il nucleo dell’omomorfismo f è detto 
insieme delle relazioni tra gli elementi x}, ..., x, del gruppo G. Questi elementi 
sono indipendenti se, e solo se, il nucleo f si compone solo dell’unità, cioè 
se f è iniettivo. Una definizione più generale di struttura algebrica libera di 
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un dato tipo, generata dall’insieme {o In} può essere data 5) Rn di 
funtori, in connessione col funtore « dimenticante della “na * ar na a . 
Il rango di ur gruppo libero ha un'interessante proprietà c ; lo disti 8 "i 
ad esempio, dalla dimensione lineare. Quest'ultima può soltanto e 
il passaggio a un sottospazio e a uno spazio-quoziente. In Ma grupp de 
di rango due, esistono sottogruppi liberi di rango finito ar cai : p n 
numerabile. Questa è una delle più tipiche manifestazioni degli effetti spe 
- tatività nell’algebra. i 
mu I gruppo libare permette d’introdurre gene costru- 
zione: la rappresentazione del gruppo mediante generatori e re di du 
Sia I un insieme arbitrario. Allora si può costruire un gruppo ( ne i 
nente /Z e detto gruppo libero con insieme di generatori J, ra ia 
seguente proprietà: per qualunque gruppo G avente una FE pod o. i - 
{x;| tel, x;e G} esiste un unico omomorfismo di gruppi } ; : 1) Atena 
f@®)=%x;. 11 gruppo G(I) è detto libero con l'insieme ibero di s 
Esso è definito in modo unico. Il gruppo G,, sopra considerato è G(y, ...,Yn 
ve notazioni. x 
i diverso dall’unità del gruppo G (I) si presenta e 
mente nella forma i{1...if#, dove i;€I, a; sono numeri interi, 7,71; ti per co i 
Qualunque sottoinsieme di elementi } del gruppo G permette di co - 
rare in G due sottogruppi: Gy e Ny. Qui G; è il più piccolo SORTED ta 
che contiene 7, cioè è l'intersezione di tutti i sottogruppi Sai + i 
Ny è il più piccolo divisore normale di G che contiene S. po 2 
sistema di generatori del gruppo G se Gy =: Se 7 è un = ‘ sur Li 
del gruppo G, allora ogni applicazione dell insieme I su 7 a n pp 7 
cazione suriettiva G(1)-+G e definisce cosf un isomorfismo de gruppo G 
gruppo-quoziente di G(/) rispetto a un suo divisore ge dei do 00) 
Sia ora KCG(I) un insieme di elementi del gruppo libero, Nx <6 di) 
il divisore normale da esso generato. È d'uso dire che il gruppo quozie 
G(1)/Ny è dato dall’insieme di generatori I e di relazioni È Licia Loi 
Molti gruppi concreti, ad esempio i gruppi Gio i degli sp “i Na ” 
logici, sono naturalmente dati mediante generatori c;telazioni. Il _ spa 
problema è detto «il problema dell’identità delle parole » nei gruppi: na 
che siano dati Z e K (ad esempio, siano insiemi finiti dati a ssh £ > 
come si fa a sapere se due elementi x, ye G(1) determinano i n ci î 
mento nel gruppo quoziente G(1)/Nx? Il problema dell identità elle p a 
detto decidibile con un algoritmo (per i dati I, K) se esiste » a Ca S; 
applicato a qualunque coppia x, ye G(/) dà risposta alla domanda se xy 
i i in N 5 .)* . «+ 
x “oviloy ‘diede per primo esempi di gruppi con I, K- finiti, per i i - 
problema dell’identità delle parole non è decidibile algoritmicamente. a - 
dosi sul lavoro successivo di Highmann, non è difficile costruire un dd 
semplice di tale gruppo con J finito, ma con K infinito; ni Roo da 
permettono di modificare la costruzione di questo esempio in modo da otte 
anche K finito. 


rari 
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Per la spiegazione di questo esempio basta ricordare che è possibile deter- 
minare un sottoinsieme £ di numeri naturali, numerabile ma non decidibile. 
La numerabilità di £ significa che esiste un algoritmo per l’enumerazione di 
tutti gli elementi di £ in un certo ordine. La non-decidibilità di E significa 
che non esiste un algoritmo che, una volta applicato a un qualunque numero 
naturale, risponda alla domanda se questo numero si trovi in E. Si costruisca 
ora il gruppo con i quattro generatori {a, b, c, d} e con le relazioni b-mMabm — 
=d""cd" per tutti gli me E. Non è difficile verificare che in questo gruppo la 
relazione b-zab=d-zcd® (x>1) è realizzata nel caso, e solo nel caso, in cui 
xe E. Dalla definizione di E segue allora che anche per tali coppie di parole 
il problema dell’identità risulta algoritmicamente non-decidibile. 

In questo modo si ha la seguente fondamentale condizione: può accadere 
di conoscere dall’inizio tutte le relazioni N x tra i generatori di un certo gruppo 
(come conseguenza delle relazioni date K ), ma non si è in grado di determinare 
in modo effettivo se un dato elemento di G (1) appartiene all’insieme delle rela- 
zioni Ny. Certamente, questo è un caso particolare dei fenomeni generali di 
indecidibilità delle teorie matematiche, scoperti per la prima volta da Gédel. 

In due parole, questi fenomeni consistono nel fatto che in ogni teoria ma- 
tematica formale sufficientemente ricca (nella quale cioè è inclusa la descrizione 
dell’aritmetica) esistono sempre delle proposizioni che non dipendono in essa 
da nessun sistema assegnato di assiomi, cioè non possono essere né dimostrate 
né confutate. 


Si esamineranno ora più dettagliatamente questi concetti d’indipendenza 
logica e le loro implicazioni filosofiche. 


2.4. Logica. 


La dipendenza logica è definita nel contesto seguente: viene esaminato un 
certo linguaggio formale con prefissate regole di formazione degli enunciati 
e con regole di deduzione, cioè di produzione di enunciati a partire da altri. 
Un certo sistema di enunciati & è inizialmente ammesso; si tratta dei cosiddetti 
assiomi. Tutti gli enunciati che si possono ricavare da & mediante le regole 
di deduzione costituiscono la teoria formale 7. L’enunciato P è detto indi- 
pendente da & se né P né la negazione di P non appartengono a &. È noto che 
esistono linguaggi e sistemi di assiomi talmente ricchi da poter essere consi- 
derati come modelli formali adeguati di quasi tutta la matematica, in relazione 
alle possibilità di deduzione in matematica. 

D'altra parte, la matematica ha anche un aspetto ricco di contenuto che si 
esprime con la rappresentazione non-formale della verità di un enunciato 
matematico in questa o in un'altra interpretazione nella teoria («elementare ») 
degl’insiemi. Come la formulazione degli assiomi e le dimostrazioni dei teo- 
remi in matematica sono in ultima analisi procedure finite per registrare 
ed elaborare dei testi di lunghezza finita, cosî l’idea astratta di verità si appel- 
la di regola all'idea di una serie infinita, numerabile o anche non numerabi- 
le, di verifiche. Si ammette che la congettura di Fermat («se x?+y"+2"=0; 
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x, y, 2, n interi; n>3; allora xyz=0») è vera o falsa dal momento che si può 
immaginare un’enumerazione successiva dell’insieme infinito delle quaterne 
(x, y, 2, n). Per ognuna delle quaterne la verità o la falsità dell’ipotesi di Fermat 
è verificata in modo finito. Se consideriamo potenzialmente conclusa questa 
successione di verifiche, allora essa deve contenere in sé la prova o la confuta- 
zione di tale ipotesi. 

Per le applicazioni delle scienze naturali sono essenziali entrambi gli aspetti 
della conoscenza matematica. La deduzione di un teorema non evidente da 
postulati plausibili, e la sua successiva applicazione alla chiarificazione di feno- 
meni fisici, costituisce il lavoro quotidiano del fisico teorico. Con non minore 
ragione, tuttavia, si può dire che al fisico interessa la verità del teorema più 
che la sua dimostrazione, benché la sua idea di verità si distingua molto dalla 
descrizione precedente per essere basata sulla realtà fisica. 

Il progresso della logica matematica nel xx secolo ha messo in luce il pro- 
fondo abisso esistente tra i concetti di «verità» e di «deducibilità da assiomi 
dati»: l’ultima affermazione è di gran lunga più povera, qualunque sistema di as- 
siomi si venga ad adottare. I matematici si sono già abituati all’esistenza di 
«problemi non risolvibili» all’interno della loro scienza, cioè di affermazioni, 
indipendenti dai più forti sistemi di assiomi, che sono ammessi 0 hanno la 
possibilità di essere ammessi dalla maggioranza degli scienziati. Le conseguenze 
di questa scoperta per la «scienza applicata» o, piuttosto, per la filosofia della 
scienza, sono comprese in modo assai meno soddisfacente. Non si sa come porsi 
davanti alla possibilità che in un qualche modello matematico, per esempio 
nella chimica quantistica, la spiegazione del comportamento osservato di una 
macromolecola possa consistere nell’ipotetica verità di un qualche teorema 
matematico, che risulterà formalmente non-dimostrabile. 

Questo problema, forse, non è troppo importante dal punto di vista pratico. 
Il calcolo effettivo di sistemi complessi esige spesso una tale mole di lavoro 
per cui le limitazioni sono dovute alla capacità delle macchine e alla brevità 
della vita piuttosto che a difficoltà logiche. Si è disposti ad accontentarsi di un 
modello semplificato o trasformato, di un breve riassunto di calcoli appros- 
simativi, dell’intuizione fisica e di criteri pratici di diverso genere che assicurino 
l'efficacia del modello. 

Tuttavia, il filosofo della scienza non può trascurare le circostanze indicate 
esaminando i problemi di riducibilità. La chimica e la biologia si riducono 
alla fisica? Ponendo delle domande di tal genere, bisogna anzitutto rendersi 
conto che si tratta sempre di un modello teorico delle leggi della fisica, della 
chimica e della biologia, e non direttamente della natura. In secondo luogo, 
all’interno di qualunque modello teorico che in ultima analisi è destinato ad 
essere matematizzato, le conoscenze sottintendono forse una dipendenza logica 
o un’astrazione del tipo della verità matematica? 

L’attento esame delle diverse varianti del significato che può essere attri- 
buito al problema della riducibilità prova che esso probabilmente è stato mal 
posto e si serve di caratteri di astrattezza per i quali accettare questa o quella 
risposta è più un atto di fede che di conoscenza scientifica. I ragionamenti nei 
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ali vi si i È 
qui Li. Proposto d ein un operatore di Schròdinger per un sistema 
poi di tirare le conclusioni sul suo possibil 
o 01 i possibile comportamento, pren- 
aa - spunto da semplici postulati generali della meccanica as 
> 3 iene sostenitore della «forza vitale » potrebbe 
larare che nello spazio di Hilbert, che i i 
i I E ; corrisponde a un sistema 
si —. uno pi operatore hermitiano dell’«entelechia», che non c'è 
azi meno complessi dei sistemi fisici, e «ri ili i 
paz complessi , e «riconciliare» in questo caso i 
I della riducibilità con i loro avversari. D’altra parte, la possibilità 
pi die dell’indipendenza logica delle leggi della vita dalle 
atura non vivente nei nostri modelli m ici i i 
È non vi atematici, l 
spazio alle speculazioni di qualunque genere. ab 
Hai i ancora una volta, richiamandosi ai modelli matematici 
i astrazioni della verità e le astrazioni della deducibilità, problemi di ridu- 
verga ol sembrano strettamente legati ai problemi della 
el mezzi di descrizione forniti da una qu i i 1 
i 228 alunque lingua, in 
zione alle astrazioni dell’infinità È A a 
à che entrano forzatamente nell i 
e ente nella semantica della 
x sd > pretese di efficienza. Senza prendere posizione nei confronti 
+ s - Rn il filosofo Fu può nemmeno porre chiaramente la questione 
ilità di principio di alcuni modelli d i i 
di | ella natura ad altri, senza 
parlare dei tentativi ammissibili di soluzione di tale questione Pi 


2.5. Il calcolo delle probabilità. Lo spazio di probabilià. 


Il o sa è 
dei RS — probabilità come disciplina applicata si occupa degli «eventi 
; Tanno qui esaminate le questioni filosofich 
al problema della casualità i i ope 
] à. Nei modelli matematici di lità di «ti 
sico» l’effetto di casualità deri vasaio 
eriva dalla mancanza d’informazi i 
ico» | azione sulle condi- 
zion i 
so i - cui accade un evento, 0 dalla sua eccessiva sovrabbondanza che co- 
È; pari ra o di na sua piccola parte. Sono soggetti ad esame non 
Ividuali, ma soltanto le loro caratteristi ie ri 
CL 1 iche medie rispetto 
gl 1 Jo a un 
Ù n o a È He: aleatori di ugual tipo, cioè rispetto a si «insieme 
+ Nei modelli della fisica quantistica la casualità è i 
stat ualità è interpretat 
= da p a come 
aaa i delle cose: praticamente tutti i valori delle osservabili micro- 
i Ri e hanno carattere deterministico soltanto le affermazioni 
abilità di questi valori. In questo par i si 
Ì bilità. î agraf à 
dei modelli di tipo classico, Ù i 
a Il punto di partenza della teoria matematica è uno spazio con misura 
a ce uno spazio di eventi elementari o spazio di probabilità. L’assegna- 
Vi PD di (2 è interpretata come informazione completa su un evento 
. Assegnare un sottoinsieme misurabil 
lem i e YCL - un «ev 
2 : : ento» — 
; dr: SE PST non completa che distingue gli eventi elementari 
ria yo e classe. La misura u(Y) degli eventi è interpretata come la sua 
« Ter questo motivo la misura p è supposta non-negativa, e u(Qd)=1 
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2.6. Esempio: le prove di Bernoulli. 


Si consideri lo spazio Q,,= {0,1}x...X {o,1} (n volte). Ogni suo punto 
weQ è una successione con elementi zero o uno di lunghezza n; tutto lo spa- 
zio si compone di 2” elementi. Scegliamo i numeri p, g20, p+g=1 € definia- 
mo la misura y={,,y sulla o-algebra di tutti i sottoinsiemi di 0, ponendo 
u.(c0) = pleig”-121, dove || è il numero degli uno nella successione © (e quindi 
n-|| è il numero di zeri in essa). Non è difficile verificare che u(0,)= 
=Voeayk(0)=1, cosicché (Q,,, p) è uno spazio di probabilità. Si tratta di 
un modello per il seguente esperimento: il lancio ” volte di seguito di una 
moneta non simmetrica con la probabilità, uguale a f, di avere testa, e uguale 


a q di avere croce. 


2.7. Esempio: lo spazio di Maxwell. 


Sia N un numero intero. Si consideri un certo volume di un gas ideale 
monoatomico formato da N molecole di massa m. L'essere ideale significa 
che le molecole non interagiscono; l’essere monoatomico garantisce l'assenza 
di gradi di libertà interni della molecola, su alcuni dei quali può concentrarsi 
una parte dell'intera energia del gas E. 

La configurazione istantanea del gas verrà descritta con un punto dello 
spazio euclideo di dimensione 3N delle velocità di tutte le molecole: = 
= (Vio Vi Vi | = 1, +... N), Viz è la proiezione della velocità sull’asse delle x, 
ecc. Lo spazio delle posizioni è la sfera O di dimensione (3N—1): 


> 


2E 
(toi) = mn 
Se la temperatura del gas è uguale a 7, allora l'energia media di una molecola 
è 3RT/2 (k è una costante universale), e il raggio di (2 è (3AN/m)!!?. Da con- 
siderazioni di simmetria deriva che la misura di probabilità su Q coincide 
con l’usuale misura di Lebesgue, normalizzata con la condizione p(02)=1. 
Si considerino gli eventi consistenti nel fatto che la proiezione v;, è compresa 
tra i valori a e ?. La misura della corrispondente calotta sferica per N o 


tende a 
de fa ( n) dx 
pes a REIT bl 


Questa è la legge di distribuzione della velocità secondo Maxwell. 


© 
Il 


2.8. Variabili aleatorie e distribuzioni. 


Una funzione misurabile € : Q-+R” è detta variabile aleatoria vettoriale. 
La misurabilità significa che per ogni sottoinsieme di Borel AC R” la contro- 
immagine £-1(4) è misurabile rispetto alla misura y su ©; gli insiemi di Borel 


LA AR ip: 


86 
5 Dipendenza/indipendenza 


sono gli elementi della più pi - i 
e più piccola c-algebra, in 9 (R”), comprendente tutti i 
Legge (0 distribuzione) della variabile aleatoria E è la misura pg su R? 


per la quale B)= 1 3 R Vea 
si si A LE )=4(E-1(B)), cioè Le (B) è la probabilità che i valori di E 


2.9. Indipendenza degli eventi e delle variabili aleatorie. 


Gli eventi 4, BCQ i indi 
sono detti indipendenti 
Le variabili aleatorie N n v a: 
ia ud LO mi 1, Ea : Q+R?: sono dette indipendenti se per 
vv. Ro o Tn Si ( i, Es (Aa) sono indipendenti. In modo analogo 
Peel Ba, Reg . i 

i miglia di variabili aleatorie totalmente indi- 
l 0 delle variabili aleatorie su uno spazio di probabilità (Q ) è un 
0) i Hi Sa osservabile» e tanto grande quanto lo nia 
e del modello con l’esperimento si i i soli i 

I : realizza di solito utili 
piccolo numero di funzionali sulle iabili i Te, 
iccc variabili aleatorie. Fra i più ici e i 

ro di fu ; sempli 

più AIA di essi sono annoverate la speranza stima e la sita 
Ice speranza matematica della variabile aleatoria scalare E:Q4SR il 


«valore medio» ME= (+4 
medic = fto x). Lo scart i i 
matematica viene kan 2 Di III ani 


+00 
DE=M(E-ME?=| (E-MEP du; (x). 


Il numero cov = 
e da mE M(é- ME) (n--Mn) è detto covarianza delle due 
ia 7: £2+R. Dalle definizioni segue facilmente che se È 
Se SERA so allora cov (€, n)=o. Per questo nel caso generale cov(E n 
ia merica più semplice di dipendenza (sarebbe meglio dire di 
i DIE enza») delle variabili aleatorie E, n. Giacché, come non è difficile 
i. n) Di: DÉ+Dn+2 cov (6, n), la varianza della somma di variabili 
Sr Ipendenti è uguale alla somma delle loro varianze 
a DI . E: A 
19% a (Q,., pi) lo spazio di Bernoulli. Si scelgano due sottoinsiemi 
Sa NJ=%, due funzioni f :Z->{o,1}e g: F- {o,1}, e si defi 
RIG S ra gli eventi, formati dai punti %, per i quali fe restrizioni di 
LL coinci Se A na con f, g. Questi eventi, come si può 
» sono Indipendenti. Intuitivamente ciò è i * 
lip . ciò è in accordo col f: 
sapere che sono usciti testa o i gn 
per i croce durante i i di ice ni 
+ risul ili gli esperimenti di Z non dice niente 
i I discendono dall’ipotesi che le caratte 
01 Interessanti del fenomeno sono izi i i 
i S condizionate dall’az i 
SE 1 fen ione di u 
pina pui di fattori aleatori indipendenti. Da ciò deriva che molti Lon 
Li ia att come asserzioni sul comportamento asintotico di funzionali 
aa ui odia di variabili aleatorie indipendenti. La deduzione 
uzione di Maxwell, in sostanza, si ià ita di li 
Si darà ancora qualche esempio. RA 
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2.10. Legge dei grandi numeri. 


La si cita nella formulazione più semplice di Ceby$ev. Si supponga che su 

(Q, u) sia data una successione di variabili aleatorie a due a due indipendenti 

13 ++ E) +. con uguale speranza matematica a e con varianze uniformemente 
limitate: DE,<c per tutti gli i. Si ponga 


e si indichi con p, (e) la misura dell'insieme per cui |É,—@|>e. Il teorema di 
CebySev dice che, qualunque sia e>0, p,(€)-»0 per n-+co. In altre parole, 
se N è sufficientemente grande, allora il valore medio di (&,) per #<N con 
probabilità quasi 1, differisce arbitrariamente poco da a: le deviazioni acciden- 
tali da a in caso di addizione hanno la tendenza a crescere molto più lentamente 
del numero dei termini addizionati. 


2.11. Il teorema di Poisson. 


Si consideri la successione degli spazi di Bernoulli (0, Wp, gn): =; 231 
Sia ||, la variabile aleatoria Ww+|@| su Q,. Supposto che per n-+co risulti 
P,-70 in modo che esista il limite lim np, =, allora per ogni &=0, 1, 2,... 


Ni-Yoo 
la probabilità dell'evento |c0|,= tende, per 1-+00, a (A%/RI)e. 

Lo spazio dei numeri interi non negativi Q={0o, 1, 2, ...} con la misura 
u(k)=(24/k!)eA si chiama spazio di Poisson. Pit in generale, la variabile 
aleatoria È : Q+ fo, 1, 2, 3, ...}, per la quale pe(k)=(2%/k/)eA, si chiama va- 
riabile aleatoria con distribuzione di Poisson. 

Intuitivamente essa descrive la distribuzione del numero delle prove 
«riuscite » nelle serie lunghe, nelle quali la probabilità di successo (0, piuttosto, 
d’insuccesso) è limitata in modo inversamente proporzionale alla lunghezza 
della serie e le prove sono indipendenti. In realtà si può ammettere una dipen- 
denza non troppo forte delle prove senza cambiare le conclusioni del teorema 
di Poisson. Tuttavia una forte dipendenza, cioè la «contagiosità del caso», 
viola questa deduzione. Si hanno tali situazioni quando la messa fuori servizio 
di elementi isolati di un sistema grande provoca immediatamente la messa 
fuori servizio degli elementi legati ad essi, o quando è studiata la statistica delle 
malattie infettive. 


2.12. Teorema di Moivre-Laplace. 


Esso ha a che fare con la successione degli spazi di Bernoulli (£2,,, &y, 9); 
dove p e q non dipendono da x. Si considerino, come prima, le variabili aleatorie 
[0], : © ||. In virtà della legge dei grandi numeri, (|co|,/n) >) se n> 
con probabilità uno. Il teorema di Moivre-Laplace dimostra che la deviazione 
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||, dal valore np cresce proporzionalmente a 7. Più precisamente, s’intro 
, > 


duca la variabile aleatoria v (0)=(| 
in (0)=(|0|,—np)/Vnpq su Q,,. AII i 
xeR e per 2-0 la probabilità che v,>x tende ila funzione FORIO 


I Hol 


2 
e 92 dy. 
v2r y 


La variabile aleatoria € con distribuzione 


I 
pel Fa [cca 
A 


è det i i i i 
a una ir 1 parametri (0, 1)). Si tratta di una distribuzione notevole 
ca pi n ruolo importante nell’intero spettro dei modelli probabilistici, 
a i e SX di ciò è spiegata dal cosiddetto teorema limite centrale di 
E pi qual ‘e mostra che la conclusione del teorema di Moivre-Laplace 
vera se c'Interessa la deviazione dalla i i 
4 media della somma d labili 
ua "essi i la me 1 variabili 
torie totalmente indipendenti con deboli limitazioni sulle loro distribuzioni 


(si osservi che [©|,, 


n 
è 1 i IE 
naz a somma pari (0), dove È; è la i-esima coordinata del 


2.13. Teorema limite centrale. 


È é h È 4 i î n i 
- rn in molte varianti: si formulerà qui la variante di Ljapunov 
1» 52, —.. Una successione di variabili aleatorie indipendenti su uno spazio 


di probabilità e si su ppon a che per ogn k esistano le randezze M E = 
8 1 Li 
8 S & ti ko 


si supponga che per n-co si abbia 
n 
B7° > M|E,— a}? 
n pal IE ax] +0 


(condizione di Ljapunov). Si indichi con V» la variabile aleatoria 


=Ba($ €;-0)) 


In questo ca ilità 
so la probabilità dell’ i 
(VER feet Pi l'avvenimento V,<x, xe R, tende verso 
SO E Unitormemente rispetto a x. In altre parole, la distribu- 
ò a ella variabile aleatoria v, è normale con parametri (o, 1) 
ues è i i i degl 
PR cai sa ; uno degli SA fondamentali della teoria degli errori 
» dove si suppone che la grandezza regi i i 
registrata in un esperi- 
mento sia la somma del i so 
: suo «vero» valore e di un error i 
( e casuale di osserva- 
zione. i i i ) 
2 RE ripetere la sua registrazione (in una serie di osservazioni in uguali 
oni) e quindi mediare i risultati, conduce con grande probabilità al 
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valore più vicino a quello vero, perché la media della somma degli errori 
possibili in n osservazioni diminuirà per esempio come 1/V© (se oj=0 non 
ipende da k). i 
Se stessa a della radice quadrata opera nella teoria della «passeggiata 
aleatoria». L'esempio classico è il moto browniano: in un tempo t Li 
media della particella dalla posizione iniziale crescerà come VI. Ciò è condi- 
zionato dall’indipendenza della successione degli urti aleatori subiti dalla par- 
ticella come conseguenza dell’agitazione termica delle molecole. E l 
Nella teoria delle comunicazioni, ad esempio delle trasmissioni di segnali 
su distanze cosmiche, riveste un ruolo importante il problema della separazione 
di un segnale debole sullo sfondo di un forte rumore. Nella variante più iu 
plice esso può essere risolto se ogni segnale viene ripetuto molte volte perio si 
camente, e se nell’apparecchio radio viene sommato il segnale ricevuto con i 
rumore su molti periodi. Allora l'ampiezza della componente utile crescerà 
proporzionalmente al numero dei periodi, ma l'ampiezza del rumore Li. 
rà proporzionalmente soltanto alla radice quadrata di questo numero, dar é 
si potrà separare il segnale dal rumore dopo un numero sufficiente di ripe- 
tizioni. Qui, senza dubbio, si suppone anche che il carattere del rumore d 
diversi periodi sia aleatorio e indipendente, cosicché essi daranno luogo a 


interferenze. 


3. Sistemi chiusi e interazioni. 


3.1. Generalità. 


Fra tutte le astrazioni della scienza moderna, che esprimono l’idea di di- 
pendenzafindipendenza, quella centrale è, probabilmente, la concezione Si 
stema chiuso. Si suppone che esistano, o che possano essere create ara 
mente o, infine, che si possano immaginare in un esperimento mentale, S e 
parti dell’universo, la cui evoluzione, in un determinato periodo della o 
esistenza, avviene secondo loro proprie leggi interne. In questo periodo i 
mondo esterno o non ha in generale interazione con il sistema (il sistema è 
isolato oppure è libero), oppure quest’interazione può essere descritta somma- 
riamente e il suo effetto è incluso nelle equazioni che definiscono la struttura 
e l'evoluzione del sistema («vincoli», «parametri esterni ), ecc.) 

Un’astrazione di tal genere è sottintesa quando la fisica parla di « I 
di un gas a una data temperatura e pressione », di «atomo dell’idrogeno», di 
«sistema solare» o di «campo elettromagnetico nel vuoto». 

L’analisi di un sistema complesso ha lo scopo d’individuare quei sotto- 
sistemi potenzialmente chiusi e più semplici. La sintesi ricostruisce la rete 
delle loro effettive relazioni, delle loro interazioni, ecc. n 

L’idea di sistema chiuso presenta diversi aspetti. L'aspetto della limitatezza 
della sua esistenza nel tempo conduce a mettere in evidenza le « condizioni 
iniziali », cioè le condizioni al momento della sua nascita come sistema chiuso, 
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oppure le sue caratteristiche nel momento in cui cominciamo ad osservarlo. 
(Questo momento può riferirsi, nei modelli matematici, a un passato infinita- 
mente remoto, cosa che non cambia il nocciolo della questione, infatti «l’infi- 
nitamente tanto tempo fa» viene ad essere semplicemente «molto tempo fa 
in confronto con la durata temporale caratteristica della vita del sistema». 
Negli esperimenti sulla dispersione delle particelle elementari, «molto tempo 
fa» può significare «frazioni di microsecondi fa», e il tempo caratteristico della 
vita può essere dell’ordine di 10-!° secondi e meno). L'aspetto di limitatezza 
di un sistema chiuso nello spazio può essere espresso inserendo la descrizione 
sommaria della sua interazione col resto dell’universo sotto forma di asse- 
gnazione delle «condizioni al contorno»: sulla superficie di un grave è costante 
una data temperatura; sull’oscillatore agisce una forza conosciuta; il campo si 
annulla all’infinito. 

In parte nella meccanica classica, ma ancora di più in quella quantistica, 
è essenziale l’aspetto duale della localizzazione del sistema, non nella rappre- 
sentazione spazio-temporale, ma in quella impulsivo-energetica. Ad esempio, 
si può parlare in modo convenzionale della localizzazione spazio-temporale 
di un fotone, soltanto nei momenti del suo assorbimento o della sua diffusione. 
Al di fuori di questi momenti il fotone possiede soltanto un’energia finita e 
un impulso. Questo è solo uno degli aspetti della complessità del significato 
di sistema chiuso nella meccanica quantistica. 

La separazione delle «leggi della natura», cioè delle leggi dello sviluppo 
dei sistemi chiusi, dalle condizioni iniziali e al contorno, è alla base dei moderni 
principî della descrizione scientifica del mondo. Le leggi della natura sono 
scritte nella lingua delle formule matematiche e costituiscono il supporto 
discreto, finito, esplicito della conoscenza scientifica. Le condizioni iniziali e 
al contorno si riferiscono alla componente infinita, continua, variabile. Ora, 
chiaramente, l’idea matematica del continuo non può essere espressa in ulti- 
ma analisi nella sua necessaria pienezza; le sue interpretazioni operazionali 
non sono meno deboli, poiché l’idea del continuo si basa sulle astrazioni del- 
la divisibilità illimitata e (potenzialmente) della misurazione arbitrariamente 
esatta. 

A questo punto è naturale accostarsi al terzo aspetto, forse il meno evidente, 
della presentazione dei sistemi chiusi. Esso consiste nell’osservare che il con- 
cetto di sistema chiuso implica inevitabilmente la precisazione del limite del 
dettaglio con il quale il sistema stesso viene esaminato. 

Il sistema solare come oggetto della meccanica celeste viene di regola ana- 
lizzato non solo come isolato dalla parte restante della nostra galassia, ma 
inoltre i pianeti vengono ritenuti punti materiali, provvisti di una massa, 
ma né di volume né definiti da una struttura fisico-chimica. Il campo elettro- 
magnetico nell’approssimazione classica si basa sul modello di una coppia di 
vettori degli sforzi, variabili con continuità da un punto all’altro dello spazio 
e da un momento all’altro del tempo, senza che si tenga conto dei fenomeni 
quanto-meccanici. Il volume di un gas come oggetto macroscopico può essere 
descritto dalla sua equazione di stato indipendentemente dalla rappresentazione 
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atomica. Per dirla in breve, se anche con grossolana approssimazione, si con- 
sidera un sistema fisico isolato dal restante mondo infinito (oppure molto 
grande), esso appare ancora un mondo infinitamente complesso, qualora si 
decida di descriverlo in tutti i dettagli. Ogni sua immagine matematica trascura 
quei particolari che sono caratterizzati da sufficientemente piccole caratteristiche 
spazio-temporali e/o impulso-energetiche. Le piccole fluttuazioni si compen- 
sano; non verranno presi in considerazione piccoli spostamenti energetici; 
ecc. ecc. Perciò è possibile dire cosa verrà trascurato e cosa non verrà preso in 
considerazione, soltanto in rapporto a un modello ulteriore più esatto del 
sistema; allora può risultare che gli effetti che dànno solo piccole correzioni 
alle caratteristiche di cui ci si è precedentemente interessati, svolgano tuttavia 
un ruolo determinante nel quadro del mondo come lo conosciamo noi. La 
scoperta dello spin dell'elettrone spiegava dapprima soltanto piccolissime 
deviazioni di un fascio di elettroni negli esperimenti del tipo di quelli di Stern- 
Gerlach, o la decomposizione appena percettibile delle linee spettrali. Tuttavia, 
dopo la scoperta del legame dello spin con la statistica (principio di Pauli), 
risultò che l’esistenza di atomi stabili e, in ultima analisi, di corpi materiali, 
è assicurata dalle proprietà di questa sorprendente «osservabile non-classica ». 
Qui si accennerà soltanto brevemente al problema dell’esistenza di diversi 
livelli di descrizione di questo o quel sistema, quando due «modelli vicini» 
differiscono nella loro struttura in modo cost forte come quello classico e quello 
quantistico. Si osserverà soltanto che la relatività dei concetti di « dipendenza/ 
indipendenza» si manifesta con particolare evidenza per l'appunto in congiun- 
zione con tali modelli. 

Forse questo aspetto di «rozzezza della descrizione» di un sistema chiuso 
è più evidente nei modelli cosmologici. Oggetto del modello cosmologico è 
«tutto l'universo in ogni tempo». Anche non analizzando esempi concreti, 
non è difficile immaginarsi che un cosf immenso «sistema chiuso» può diventare 
oggetto dell’osservazione fisica soltanto dopo l’astrazione da quasi tutte le 
caratteristiche dell'universo con le quali ha a che fare quasi tutta l’altra scienza. 


3.2. I sistemi classici e il principio della minima azione. 


Nella descrizione matematica dei più svariati sistemi isolati ha un ruolo 
fondamentale uno schema generale per la deduzione delle equazioni dell’evo- 
luzione: il principio della minima azione. 

Ecco un breve ed evidente esempio: s'immagini un punto materiale — cioè 
una «pallina» che può muoversi in una scanalatura curva su di un piano verti- 
cale, in virtà della forza di gravità — e si trascurino sia l’attrito sia la rotazione 
della pallina. La descrizione matematica di questo sistema è costituita dai 
seguenti oggetti: 

a) Spazio delle configurazioni (spazio degli stati) del sistema. È l’insieme di 
tutte le possibili posizioni istantanee della pallina. Queste ultime possono essere 
rappresentate con un numero reale g, cioè con una coordinata che, tuttavia, 
può essere introdotta in molti modi differenti: ad esempio, calcolando la 
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distanza della pallina da un punto prefissato lungo l’orizzontale o lungo Ia 
scanalatura, oppure modificando la sua coordinata angolare relativamente a 
un punto opportuno. Il sistema possiede un grado di libertà; il suo movimento 
è unidimensionale; la scanalatura rappresenta il «vincolo » imposto alla pallina. 

5) Spazio delle fasi del sistema. È l’insieme delle coppie (4, g), dove q è 
la coordinata della posizione istantanea della pallina, e g è la rapidità della sua 
variazione nel tempo. Durante le diverse traiettorie del movimento della pal- 
lina essa può passare da un punto a un altro con diversa velocità, per questo 
le coppie di valori (9, g) possono descrivere tutto il piano (o una sua patte, 
se la lunghezza della scanalatura è finita e/o se le velocità per un qualunque 
motivo sono limitate). Teoricamente si potrebbe considerare anche lo spazio 
delle possibili terne (9, g, d) (coordinata, velocità, accelerazione), ma nei sistemi 
meccanici di tale tipo tutta la traiettoria reale del sistema è definita semplice- 
mente dalla posizione e dalla velocità iniziali: l’accelerazione è localmente defi- 
nita da queste ultime, e quindi l'integrazione delle equazioni differenziali del mo- 
vimento fornisce tutta la traiettoria. Nei sistemi più complessi lo spazio delle fasi 
può includere particolari gradi di libertà per varie derivate d’ordine superiore. 


Quadro delle fasi del sistema. Si tratta delle curve nello spazio delle fasi, 
rappresentanti (g(t), g(t)) per tutti i movimenti reali possibili della pallina, 
per teR. Queste curve sono dette anche traiettorie nello spazio delle fasi. 
Nella descrizione nello spazio delle fasi possono esservi traiettorie formate da 
un solo punto: la posizione di equilibrio della pallina; in esse la velocità è 
uguale a zero, e la coordinata q corrisponde alle posizioni di «buche» e di 
«sommità » della scanalatura. La pallina nella buca si trova in equilibrio stabile: 
se la si allontana un po’ verso la parete e la si lascia andare, incomincia a rotolare 
da una parte all’altra, rimanendo tutto il tempo vicino al fondo. La pallina 
sulla sommità si trova in equilibrio instabile: se la si allontana un po’ verso la 
parete e la si lascia andare, rotola in giù. Sono inoltre possibili dei casi degeneri: 
i tratti orizzontali della scanalatura e i punti di flesso dove la scanalatura a 
sinistra sale, e a destra scende, ma in quel punto la tangente è orizzontale. 
Se la forma della scanalatura è descritta da una funzione regolare, allora tutti 
i punti di equilibrio sono gli estremi dell’altezza della scanalatura come funzioni 
di una coordinata orizzontale: per piccoli spostamenti lungo l’orizzontale la 
parte lineare della variazione di altezza è uguale a zero. 

In fisica è più ragionevole lavorare non con una scanalatura alta, ma con 
l’energia potenziale della pallina V (9) nel campo di gravità (calcolata a partire 
da un prefissato livello orizzontale). Nelle posizioni di equilibrio V (g) è estre- 
male. 


Piccole oscillazioni. Le traiettorie generali del movimento della pallina 
possono avere forme abbastanza complicate, ma esiste un’importante classe 
di movimenti che ha una struttura molto semplice: piccole oscillazioni intorno 
alle posizioni di equilibrio stabile. Se qg è scelta opportunamente e g=q=0 


x 


nella posizione di equilibrio, allora il movimento è vicino all’oscillazione di 
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un oscillatore armonico: j+k°*9=0, g= A cosk(t—t). È necessario soltanto 
che V(g) in prossimità di g= 0 abbia la forma di una parabola V(9)>9% a meno 
di termini d’ordine superiore; un adeguato piccolo cambiamento di q la tra- 
sformerà allora in una parabola esatta, ma una opportuna modificazione di d 
renderà il movimento armonico. Le piccole oscillazioni rappresentano uno dei 
processi fisici più stabili; con ciò si spiega in parte il ruolo degli oscillatori 
armonici negli altri processi fisici. 


Leggi di conservazione. Sia E l'energia cinetica e V l’energia potenziale 
della pallina: si tratta di funzioni sullo spazio delle fasi. Allora su ogni traiettoria 
la somma E+V è conservata: questa è la legge di conservazione dell’energia. 


Introduzione delle interazioni con il mondo esterno. A rigor di termini, sin 
dal principio il sistema non era isolato: sulla pallina agiva il campo esterno 
della gravità. Tuttavia, lo si è potuto descrivere come isolato, ritenendo questa 
azione conosciuta in anticipo e non dipendente in alcun modo dal comporta- 
mento della pallina stessa: è sostanziale per l’appunto quest’ultimo fatto. 
Inoltre, il campo di gravità è potenziale e non può compiere lavoro in un ciclo 
chiuso del moto del sistema. 

Inoltre si sarebbe potuto prendere in considerazione l’attrito della pallina 
con la scanalatura: esso produce dissipazione di energia (per trasformazione 
in energia termica) e in fin dei conti piccole oscillazioni smorzate; questo è 
ancora uno dei motivi per cui le piccole oscillazioni sono importanti. 

l Si sarebbero potute includere anche una fonte esterna di energia, ad esem- 
pio un campo magnetico variabile, che metta in moto la pallina (di ferro) 
o una variazione della forma della scanalatura a causa di un influsso esterno. 
Nell’articolo «Continuo/discreto» di questa stessa Enciclopedia si erano osser- 
vati i risultati «catastrofici» sul movimento della pallina che in tal modo pos- 
sono verificarsi: ad esempio, la caduta in una piccola buca creatasi in un lato. 


Commento. Nonostante tutta la semplicità di quest’esempio, il complesso 
dei principali concetti sopra descritti si adatta a molti sistemi chiusi più com- 
plicati. Ogni modello matematico presuppone una più o meno evidente intro- 
duzione dello spazio degli stati. Le coordinate generalizzate in questo spazio 
possono essere indipendenti oppure soddisfare relazioni del tipo «vincoli». 
La prima e fondamentale complessità del sistema consiste nella dimensione di 
questo spazio: il numero dei gradi di libertà del sistema. Nei sistemi meccanici 
esso è finito, ma rifiutare il principio delle «azioni a distanza» richiede l’intro- 
duzione dei campi; il «valore istantaneo del campo » è una funzione in una re- 
gione dello spazio, cioè l’insieme infinito dei suoi valori in tutti i punti della 
regione: in questo senso lo spazio dei valori del campo ha dimensione infinita. 
Il modello di un gas come insieme di particelle classiche in una scatola ha, a 
rigor di termini, dimensione finita, ma la sua dimensione è cost grande (numero 
di Avogadro »10°8) che è «praticamente infinita». 

Le posizioni di equilibrio del sistema possono avere un ruolo molto im- 
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portante e spesso sono definite come punti estremali di un opportuno funzio- 
nale sullo spazio degli stati o sullo spazio delle fasi. 

Le leggi di conservazione delle diverse grandezze possono esprimere in 
modo molto evidente l’«isolamento » del sistema. Se vi è un numero sufficiente 
di grandezze che si conservano, già lo stesso fatto della loro esistenza permet- 
te di ricevere un’informazione molto importante sulle proprietà dell’evoluzione 
del sistema. 


Traiettorie virtuali e azione. Si dà ora una descrizione più precisa degli 
schemi matematici corrispondenti. In essa ha un ruolo importante un principio, 
profondo e non evidente, delle scienze naturali, secondo il quale il movimento 
di un sistema può essere spesso descritto come la sua «posizione di equilibrio » 
in un senso generalizzato del termine. Con più precisione, si considerano i punti 
dello spazio degli stati della pallina nella scanalatura come «stati virtuali di 
equilibrio» del sistema; tra di essi gli stati effettivi di equilibrio sono indi- 
viduati come punti estremali della funzione «energia potenziale». In modo 
analogo è possibile considerare tutte le possibili curve parametrizzate (g(t), 
G(1), te<t<t nello spazio delle fasi come «traiettorie virtuali» della pallina 
e tentare d’individuare tra di esse le traiettorie effettive come estremali per un 
certo funzionale. Tale funzionale esiste effettivamente: è detto azione e viene 
scritto f{L(g(1), g(t), t) di, dove L è un’opportuna funzione (nel caso della 
pallina nella scanalatura è la differenza fra la sua energia cinetica e quella po- 
tenziale). Si tratta del cosiddetto principio della minima azione (0, più preci- 
samente, dell’azione estremale). i 

Più in generale, a ogni sistema chiuso di una determinata classe si fa cor- 
rispondere una struttura matematica (E, S) formata dall'insieme E delle 
«traiettorie virtuali» del sistema e dalla funzione .S : E+R a valori reali, che 
possiede fisicamente la dimensione di un lavoro e il cui valore è detto azione 
della traiettoria virtuale data. La classe delle traiettorie reali del sistema viene 
scelta con la condizione che l’azione su di esse ammetta un valore massimale, 
per lo meno in un senso locale. L’insieme £ si realizza di solito come l’insieme 
delle sezioni locali di un fibrato differenziabile. Le coordinate locali in tale 
fibrato sono dette coordinate generalizzate del sistema. L'azione è data di regola 
dall’integrale di una forma differenziale che dipende dalle coordinate generaliz- 
zate del sistema e dalle loro derivate sulla base del fibrato: questa forma è 
detta densità lagrangiana del sistema. La condizione di minimalità dell’azione 
è sostituita dall’annullamento della sua variazione prima nel senso del calcolo 
delle variazioni, che conduce alle classiche equazioni di Eulero-Lagrange. Si 
dànno qui di seguito alcuni esempi. 


Sistemi meccanici. Sia N una varietà differenziabile, i punti della quale 
sono interpretati come posizioni istantanee del sistema. (Generalizzazione del- 
l’esempio iniziale). L'insieme delle traiettorie virtuali E è l’insieme delle im- 
magini delle applicazioni R+N definite sui segmenti [t,, #] della retta del 
tempo R o, il che è lo stesso, l’insieme delle sezioni locali della proiezione 
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NxRR. Queste immagini sono supposte differenziabili il mumero neces- 
sario di volte. 

Siano (91, ---, 9,) delle coordinate locali su N che ricoprono completamente 
una traiettoria virtuale (9, (t), ..., gn (), to<t<t,. Allora l’azione in essa è 
definita da un integrale del tipo 


a.( dai  d'q 
si, — dt 
Cel 


La funzione L(g;, di, d;), dove tutte le g; e le derivate sono considerate variabili 
indipendenti, è detta lagrangiana del sistema, o densità lagrangiana. In molti 
modelli = 1, e per semplicità ci si limiterà a questo caso. 

Come è stato detto, le traiettorie reali si distinguono, tra quelle virtuali, 
per la condizione di estremalità dell’azione. Per la deduzione delle equazioni 
differenziali del moto questa condizione viene un po’ modificata e, seguen- 
do Eulero e Lagrange, viene sostituita con l’estremalità locale dell’azione nel 
seguente senso. Si consideri la traiettoria g;(#) e una sua piccola variazione 
(9; (1)+3g;(t)), dove le funzioni 3g; sono diverse da zero esattamente all’interno 
di [%,, #1]. Nell’approssimazione lineare rispetto a dg; la variazione dell’azione ha 
la forma 


ti ò ò 
S(@+39)-S)= P|LO MEL dir 
DA di di 


. 
iufoL -d se) 
= | dqdt. 
il Da dt dà, i 
L'ultima espressione è ottenuta integrando per parti il termine (dL/dg;) dg; dt, 
e tenendo conto del fatto che dg;(t)=3g;(t,)=0. Sotto ipotesi analitiche natu- 


rali, servendosi dell’arbitrarietà degl’incrementi dg;, è possibile da qui dedurre 
che lungo le traiettorie reali 


Queste sono le equazioni differenziali di Eulero-Lagrange. Eccettuato un in- 
sieme singolare, esse determinano il movimento del sistema quando siano asse- 
gnate le sue coordinate generalizzate (g;) e le velocità generalizzate (g;) nell’i- 
stante iniziale #y. 


Osservazioni complementari. Dal punto di vista matematico è meglio la- 
vorare senza le coordinate locali nel sistema delle definizioni fondamentali. È 
possibile fare ciò se si associa ad ogni fibrato regolare NM la successione 
di fibrati regolari ..+XN-+#1N+...4... +3°N = N-+ M chiamati fibrati dei 
getti. Un punto di 7*N corrisponde a una classe di sezioni locali del fibrato 
N M, che hanno un contatto con ordine di tangenza non inferiore a £ in un 
dato punto di N. Le densità lagrangiane sono definite in tale ambito come 
forme differenziali esterne su un 7*N, aventi dimensiòne massima «lungo la 
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base » di MM e dimensione nulla «lungo le fibre». L’integrale della restrizione di 
una tale forma a una sezione locale è l’azione di questa sezione rispetto alla 
data densità lagrangiana. . 

Il formalismo variazionale diventa, in questa variante, un nuovo capitolo 
assai interessante della. geometria differenziale. va: 

Un sistema di N punti materiali interagenti nello spazio-tempo galileiano 
è di solito descritto con il seguente modello. Le coordinate generalizzate 
{4i,> di di} sono le 3N coordinate delle posizioni dei punti î= 1, ..., N, in un 
sistema di coordinate cartesiane. Posto 


3 
vi =} dî 
Fi 
allora la lagrangiana del sistema ha la forma 
N mv? 
L-Y PE V(9y). 


Qui m, è la massa del punto i-esimo, V(g;;) è una funzione delle posizioni dei 
punti. Il termine 


viene detto energia cinetica del sistema, V è la sua energia potenziale. vi 

La descrizione dell’evoluzione mediante la lagrangiana e mediante il si- 
stema delle equazioni di Eulero-Lagrange si applica non soltanto a sistemi 
isolati nell'accezione più ristretta del termine, ma anche a sistemi che hanno 
interazioni con un altro sistema se l’evoluzione di quest’altro sistema può 
ritenersi assegnata, e se è possibile trascurare l’influenza reciproca esercitata 
su di essa dal primo sistema. Caso tipico è il movimento di un sistema di punti 
materiali in un campo esterno, gravitazionale o elettromagnetico, che è pro- 
dotto da oggetti (come nell'esempio della pallina) con massa molto grande 
(a confronto del sistema). 

In matematica l’influsso del sistema esterno si manifesta sulla forma della 
lagrangiana nel modo seguente. Immaginiamo che il nostro sistema chiuso I 
e il sistema II che agisce su di esso siano riuniti in un sistema generale isolato 
I+II, la lagrangiana del quale ha l'aspetto LZ (gr, dr; gr, dr) Ritenendo Qu du 
funzioni conosciute del tempo, possiamo sostituirle in L. Variando gi e dr, 
le equazioni di Eulero-Lagrange per il sistema I avranno formalmente l’aspetto 
di prima, ma L dipenderà dal tempo. Inoltre, per un sistema di particelle 
nello spazio «vuoto», V deve dipendere soltanto dalle posizioni reciproche 
delle particelle, cioè dalle differenze delle loro coordinate spaziali. La presenza 
del sistema II può turbare questa simmetria rispetto a tutte le traslazioni 
spaziali, e V può immediatamente cominciare a dipendere da alcune coordinate 
o dalle loro funzioni. 


Leggi di conservazione e di simmetria. Caratteristiche di estrema impor- 
tanza di un sistema chiuso sono i suoi integrali di moto: tali funzioni f(g;, d;) 
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(ed eventualmente derivate di ordine superiore, se da esse dipende la lagran- 
giana) sono costanti, cioè non dipendono dal tempo, su ogni traiettoria del 
sistema. Vengono anche dette leggi di conservazione qualora possiedano la 
proprietà di additività, cioè si sommino in caso di unione di due sistemi senza 
interazioni (ad esempio, diffusi spazialmente). Si usa questo termine come 
equivalente a quello di integrale di moto. 

Le leggi fondamentali di conservazione sono collegate alle simmetrie del 
sistema (teorema di Noether). Si supponga che sul fibrato NxR agisca un 
gruppo a un parametro di trasformazioni che conservano la lagrangiana, e 
che in coordinate locali quest’azione trasformi il punto (£, g;) nel punto 
(Î(41); fi(4;t,2)), dove X è il parametro del gruppo. In questo caso la gran- 


dezza 
dL.\òèf òL df, 
={[L{[-\V__g.\ eee 
è | Lat)a ta dì 


resta costante su qualsiasi traiettoria. 

Un sistema meccanico chiuso possiede un gruppo di simmetria a sette 
parametri: il gruppo a quattro parametri delle traslazioni dello spazio e del 
tempo, e il gruppo a tre parametri delle rotazioni dello spazio euclideo. Con 
riferimento a ciò, per un tale sistema esistono sette leggi fondamentali di con- 
servazione: dell’energia, delle tre componenti dell'impulso e delle tre com- 
ponenti del momento dell’impulso. 

La conservazione dell’energia corrisponde al gruppo f#+?#+4; l’energia è 
espressa dalla formula 


òL. 
E} gh h. 


La j-esima componente dell’impulso di un sistema di punti in coordinate 
cartesiane è 
s òL » 
—= dj 
7 d%; 
Il vettore del momento dell'impulso di questo sistema in coordinate carte- 


siane è Vidi dove Pi=M; (ki Try Lig) Ti=(%;,0 Xi x,,) e le parentesi 
v 


quadre rappresentano il prodotto vettoriale. 


La teoria della relatività speciale. La lagrangiana del sistema dei punti ma- 
teriali 


Nmo? 
L= di °° V(4;;) 


sottintende ancora un'ipotesi di carattere fisico: l’istantaneità della propaga- 
zione dell’influenza di una particella sulle altre. Un cambiamento della posizio- 
ne (9;,) di» di) dell’i-esimo punto si manifesta immediatamente sull’energia po- 
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tenziale dell’interazione di tutti i punti. Quest’idea dell’actio în distans era sem- 
brata insoddisfacente, come argomentazione filosofica, già allo stesso Newton. 
Il rigetto totale di quest'idea è alla base dei modelli della teoria della rela- 
tività speciale, dove lo spazio-tempo a quattro dimensioni di Minkowski è 
il veicolo degli eventi. Esso è rappresentato matematicamente come lo spazio 
affine R‘, munito di sistemi inerziali di coordinate e di una metrica arbitraria 
ma privilegiata. Se in un dato sistema inerziale (x,, xy, x3, t) e (x, x, x{, 1’) sono 
le coordinate di due punti P, P”, allora il quadrato della distanza a quattro 


dimensioni fra di essi 
3 


> (mt) 


w1 


(c è la velocità della luce) rimane invariato in qualunque altro sistema inerziale. 

Da ogni punto P dello spazio-tempo ha origine il cono-luce Cp definito 
in modo invariante e formato da tutti i punti O, la cui distanza da P è uguale 
a zero. Le sue generatrici sono linee universali di particelle che si allontanano 
da P in modo rettilineo con la velocità della luce. Le particelle (materiali), 
cioè le particelle di massa m diversa da zero, possono muoversi soltanto con 
una velocità rigorosamente minore della velocità della luce: la tangente alla 
traiettoria di una tale particella è situata sempre all’interno del cono-luce che 
ha origine nel punto di contatto. Perciò l'insieme delle traiettorie virtuali di 
tale particella è definito come l’insieme (delle parti) delle curve differenziabili 
nello spazio di Minkowski, le cui tangenti in ogni punto si trovano all’interno 
del cono-luce. L’azione di una particella libera in una traiettoria virtuale è la 
sua lunghezza (nel senso della metrica di Minkowski) moltiplicata per la massa 
col segno meno. 

La lagrangiana di un sistema chiuso è invariante rispetto al gruppo di 
Lorentz delle trasformazioni di un sistema inerziale di coordinate in un altro. 
Questo gruppo ha dieci parametri, e pertanto il teorema di Noether permette 
di costruire dieci leggi fondamentali di conservazione per tale sistema: le 
quattro componenti dell'impulso a quattro dimensioni e le sei componenti 
del tensore antisimmetrico del momento a quattro dimensioni. 


Campo. Uno dei postulati fondamentali della teoria della relatività afferma 
che nessuna influenza (segnale) può propagarsi con velocità superiore alla 
velocità della luce. Per questo la descrizione di un sistema di punti interagenti 
non può essere realizzata mediante il termine V nella lagrangiana del tipo 
descritto in precedenza. L’analisi conduce a un punto di vista ancora più 
radicale in conformità al quale un sistema chiuso di punti interagenti non può 
in generale essere descritto in termini di uno spazio di dimensione finita nelle 
loro coordinate: è necessario introdurre lo spazio di dimensione infinita degli 
stati del campo che descrive l’interazione. Nella maggior parte dei modelli 
l'interazione è locale, cioè è definita in modo che le particelle eccitino il campo, 
che il campo agisca su di esse vicino ad esse e che punti vicini del campo 
interagiscano l’uno con l’altro. 
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Il campo classico libero, cioè il campo fuori delle particelle, è di solito 
‘realizzato matematicamente come sezione di un fibrato vettoriale sullo spazio- 
tempo MM oppure come connessione in questo fibrato. 

Ad esempio, il campo elettromagnetico «è» la 2-forma esterna chiusa F 
su M, oppure il tensore antisimmetrico di rango 2 (è possibile non indicare il 
carattere della sua varianza in virtà della procedura di innalzamento e di ab- 
bassamento degli indici con l’aiuto della metrica). Se v è la velocità a quattro 
dimensioni di una particella con carica e e con massa m, allora l’azione del 
campo £ su questa particella è descritta dalla sua equazione di moto dv/dr = 
=(e/m)F(v). Qui 7 è il tempo proprio della particella oppure, il che è lo 
stesso, la lunghezza della sua traiettoria nella metrica di Minkowski, e F è 
considerato come un operatore sullo spazio tangente (dove si trova v) con 
valori nello stesso spazio tangente (dove si trova du/d7). Nel sistema inerziale 
di coordinate (£, x,y, z)=(x9, x1, x?, x3) le componenti del tensore F= 

=YF,gdx*ndx8/2 hanno la forma 


è LE E SE 
x 
E, —-B, o By 
E, B, -B, o 
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dove E, B sono le componenti classiche dell’intensità del campo elettrico e 
magnetico. 

Non si descrivono qui le rimanenti equazioni di Maxwell per non entrare 
in dettagli tecnici, e si omette anche la descrizione della lagrangiana del campo. 


Causalità e analiticità. L’idea di causalità consiste nel fatto che la tra- 
smissione dell’interazione da una parte del sistema a un’altra avviene con 
ritardo nel tempo. Anche nei modelli di azione a distanza questo ritardo è 
assunto uguale a zero, ma mai negativo: la causa non può precedere l’ef- 
fetto. Qui interesserà un aspetto delle descrizioni matematiche di causalità: 
la comparsa, nei modelli corrispondenti, delle funzioni analitiche di variabile 
complessa. Le funzioni analitiche hanno la seguente proprietà molto significa- 
tiva di «rigidezza»: assegnare una funzione in un dominio arbitrariamente 
piccolo significa definirla in modo completo, cioè assegnarne sia l’intero do- 
minio di definizione che il valore in ogni suo punto. Si può dire che questa è 
l’espressione estrema dell'idea di dipendenza del comportamento globale del- 
l'oggetto matematico dal suo comportamento locale. 

Il meccanismo dell’introduzione delle funzioni analitiche è illustrato da 
un semplice e classico esempio. i 

Si supponga di avere un sistema chiuso del tipo di un oscillatore lineare 
e lo si sottoponga a un «influsso esterno» f(?) dipendente dal tempo # interes- 
sandosi poi della «risposta» g(t). Per l’oscillatore lineare, f(#) può presentarsi 
come una forza che «mette in moto» l’oscillatore, e g(#) come il movimento 
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risultante. Considerando il sistema come lineare, si può descrivere la risposta 
come il risultato dell’applicazione a f(t) di un operatore integrale, eventual- 
mente con nucleo di distribuzione: g(t)= SEL, #)f()dt'. Se la struttura 
del sistema non dipende dal tempo, allora L(#, #°) deve dipendere soltanto dalla 
differenza tt", e la si può scrivere come L(—t'). La condizione di causalità, 
in particolare, significa che se l’influsso F(t)=d(t-t) è un impulso dato nel- 
l’istante to, allora g(1)=0 per t<ty, e quindi L(1)=0 per t<o. Questo stesso 
sistema lo si esamini ora in una « descrizione in termini di onde », cioè lavorando, 
invece che con f(#) e g(t), con le loro trasformate di Fourier 


+00 
f(®)=| f(etiot ae 

e g(0), Î(&) definite in modo analogo. Dalle proprietà della trasformazione 
di Fourier che, in particolare, trasforma la convoluzione delle funzioni in # 
nella moltiplicazione delle funzioni in ©, risulta che 8(0=£(0)f(0). Si 
ottiene cosi una descrizione molto semplice della risposta in termini dell’in- 
flusso. La condizione di causalità si manifesta nel comportamento della fun- 
zione (+). Precisamente, dal fatto che L(1)=0 per 1<o, segue che £(&) 
può essere prolungata come funzione analitica nel semipiano superiore della 
variabile complessa © (Imw>o), oppure che il coefficiente eior per 7=o in 
modulo non supera 1 (e decresce rapidamente rispetto a /mw). La stessa fun- 
zione Î(0) per weR è il valore al bordo di questa funzione analitica. Oltre 
a ciò, la condizione L(1)=0 per t<o con alcune ipotesi supplementari, che 
qui non verranno formulate, è equivalente alla seguente relazione tra la parte 
reale e il coefficiente della parte immaginaria di È (w): 


ReL(0)= = n e) dall 


w'— 


Intl) =-2(RI@ ay, 


n (0) (0) 


+00 


Qui gl’integrali sono intesi nel senso di valori principali. Queste formule sono 
dette relazioni di dispersione. 

__ Hloro significato fisico è il seguente. Il passaggio alla trasformata di Fourier 
significa che si considera il sistema come un filtro, e che si è interessati alla 
sua risposta alle oscillazioni armoniche che si presentano come una successione 
infinita stazionaria di onde. Sembrerebbe che il sistema, che lascia passare 
bene una parte limitata dello spettro e assorbe quasi tutta la parte restante, 
debba dare in uscita oscillazioni, simili alle armoniche, indipendentemente dal 
tipo d’ingresso, e perciò «cominciare a risonare» prima che su esso abbia luo- 
g0 l'influsso. Tuttavia le relazioni di dispersione escludono questa possibilità : 
la parte reale e il coefficiente della parte immaginaria di É (6) sono legati in mo- 
do che, qualunque sia la parte assorbita dello spettro, il resto ha esattamente 
quegli spostamenti di fase per cui la risposta non può precedere l’influsso. 
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Le relazioni di dispersione hanno delle varianti e delle generalizzazioni 
molto importanti, in particolare nella teoria quantistica dei campi. 

Nella relazione iniziale per la comparsa dell’analiticità, insieme alla condi- 
zione L(t)=0 per t<o, vi è la condizione d’indipendenza del comportamento 
locale del campo in due punti, divisi da un intervallo di tipo spaziale nell’uni- 
verso di Minkowski. Essa è espressa nella forma di commutatività degli opera- 
tori del campo in questa coppia di punti: siccome un segnale da un punto non 
può raggiungerne un altro, non mette in comunicazione nessuno di essi. I 

Si osservi che lo stesso meccanismo dell’analiticità collega, nella meccanica 
quantistica, anche grandezze di diversa natura. 


L'universo come sistema chiuso. I moderni modelli cosmologici sono varietà 
a quattro dimensioni (spazio-tempo) con una metrica pseudoriemanniana 


3 
V gapdx*dx® 
a, B=0 

localmente simile alla metrica di Minkowski in coordinate localmente inerziali. 
Il moto della materia in tale spazio è definito dalla sua geometria. Ad esempio, 
ammettiamo di osservare il movimento di due particelle di prova, vicine nel 
sistema inerziale locale, con velocità u*; n* sono le componenti della distanza 
tra di esse. Le particelle si muovono lungo una geodetica, e le (y%) soddisfano 
il sistema delle equazioni della «deviazione geodetica» 


Qui 7 è il tempo proprio del sistema, D/D7 è la cosiddetta «derivata assoluta » 
lungo di esso, Ris è il tensore della curvatura dello spazio espresso mediante 
le componenti della metrica gg. 

A sua volta, la curvatura dello spazio-tempo deriva dalla materia presente 
in esso in virtù delle equazioni di Einstein 


I 
Rag n 808R = 8770 


Qui R.g, R, sono le contrazioni di Rfys rispetto agli indici corrispondenti, e 
T.,,8 è il tensore impulso-energetico della materia (compreso il campo) che è 
costruito mediante una formula nota. 

Le equazioni di Einstein hanno un gran numero di soluzioni, e la scelta dei 
candidati per i modelli cosmologici fra di esse è effettuata tenendo conto 
dei dati astronomici osservati. Nel più semplice modello attualmente ammesso 
si suppone che la materia nell'Universo sia un mezzo omogeneo, continuo e 
isotropo. Le non-omogeneità osservate nelle proporzioni <108 di anni luce 
si possono considerare come perturbazioni su una base omogenea in media, 
In tale modello esiste un sistema naturale di coordinate: gli assi spaziali delle 
coordinate sono le linee universali dei «punti» della materia, l’asse temporale 
è il tempo proprio di ogni linea universale, uguale a zero su una fissata iper- 
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superficie omogenea di tipo spaziale. Supponendo che la densità p(#) e la pres- 
sione p(#) della materia siano conosciute, allora la geometria del modello è 
una funzione del tempo a(t), il «raggio dello spazio». In conseguenza delle 
equazioni di Finstein tali funzioni verificano: 


x d 
d+3(p+p)7=0 


Il parametro & nelle unità stabilite può essere assunto uguale a +1 oppure a o. 
Per quel che riguarda p e p, sono possibili diverse ipotesi. I seguenti due 
modelli conducono facilmente alle equazioni integrabili degli «universi di 
Friedman»: p=o0, pra? («universo corpuscolare»); p=p/3, pa-4 («uni 
verso radiante»). Il caso R=+1 conduce al modello «chiuso» in tutti i tempi 
dell'universo, i casi #=0 e &#=—1 conducono al modello «aperto» (rispettiva- 
mente, piano o iperbolico). 

Senza entrare in ulteriori particolari (la descrizione di altri modelli, i dati 
sperimentali e la loro interpretazione, le possibilità di altre leggi di evoluzione 
del mondo, ecc.), si studieranno qui brevemente le questioni filosofiche poste 
dal considerare l’universo come sistema isolato. Esse in ultima analisi sono due: 
il problema dell’unicità dell’universo e il problema delle condizioni iniziali. 

Come si è già detto, i principî fondamentali della descrizione dei sistemi 
isolati sono basati sull’ipotesi della loro ripetuta riproducibilità: lo spazio degli 
stati e la descrizione nello spazio delle fasi del sistema realizzano l’idea che 
«esemplari diversi» del sistema possono attraversare diverse possibili tappe 
dell'evoluzione. Com'è possibile rendere compatibili questi principî con l’unica 
rappresentazione dell’universo accessibile alla nostra osservazione? Poiché i 
nostri modelli sono basati sull’idea dell’interazione locale, l'utilità della dedu- 
zione di queste 0 quelle equazioni dell’evoluzione consiste nella verifica della lo- 
ro validità locale nello spazio-tempo, al variare della distribuzione della materia. 

Il problema delle condizioni iniziali è più complesso per diverse ragioni. 
Non si sa da che cosa siano determinate le condizioni iniziali della fase osservata 
dell'evoluzione dell'universo la quale, evidentemente, era una fase superdensa. 
Bisogna anche tener presente che, nei primissimi stadi di compressione, il 
modello classico diventa troppo sommario e cominciano ad avere un ruolo 
dominante gli effetti quantistici, ma non esiste un’unica teoria della gravita- 
zione quantistica. Anche nei limiti del modello classico rimane inesplicabile 
il problema delle cause dell’omogeneità osservata su larga scala. Quest'ultima 
presuppone un influsso reciproco delle parti del mondo talmente forte, da 
condurre a un livellamento delle caratteristiche. Ma ad ogni punto universale 
possono essere causalmente collegati solo i punti universali che si trovano 
all’interno o sulla superficie del suo cono-luce (nello spazio curvo): all’inter- 
no cioè dell’«orizzonte» di tale punto. Nel mondo di Friedman, per estra- 
polazione all’indietro, la massa della materia che si trova all’interno dell’oriz- 
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zonte sembra tendere a zero al momento della compressione. In altre paro- 
le l'universo, nei primi momenti, si frantuma in molte regioni non collegate 
causalmente, e non c’è motivo che le caratteristiche della materia coincidano 
in tali regioni. I tentativi di venire a capo di questa difficoltà hanno condotto 
Meissner a considerare modelli anisotropi, nei quali l'universo è più simile a 
una ellissoide con tre semiassi diversi, che non a una sfera. L’evoluzione di 
questi modelli nel tempo passato rispetto al momento di espansione è di tipo 
oscillatorio. In questo regime si suppone che le oscillazioni dell’anisotropia 
permettano, nelle prime fasi, il diffondersi per tutto l’universo della radiazione, 
provocando in tal modo il suo «rimescolamento » («mixmaster universe»). La 
materia potrebbe in tal modo diventare omogenea, le oscillazioni si attenuereb- 
bero con l’andar del tempo e il modello si avvicinerebbe al modello dell’universo 
di Friedman. Tuttavia, calcoli dettagliati mostrano che, per la maggior parte 
delle condizioni iniziali, il tempo realmente passato dall’inizio dell’espansio- 
ne dell’universo risulta insufficiente per la sua riduzione allo stato omogeneo, 
e il problema rimane insoluto. 

L'aspetto della cosmologia che qui interessa, cioè il problema della reciproca 
dipendenza delle parti dell’universo, si presenta molto chiaramente ancora in 
una serie di modelli fisici, in questo caso di carattere più locale, cioè nei modelli 
dei «buchi neri». 


Buchi neri. Secondo le equazioni di Einstein, la massa-energia incurva 
lo spazio. Questa curvatura può essere cosî grande da chiudere una qualche 
regione dello spazio nel senso che qualunque curva nello spazio-tempo, fatta 
uscire dalla sua frontiera, dovrà avere delle parti che si trovano fuori dal cono- 
luce, e perciò non realizzate come linee universali di particelle di massa non 
nulla oppure di raggi di luce. Tale regione è detta buco nero [cfr. Rees, Ruffini 
e Wheeler 1975]. Nessun evento accaduto all’interno di essa può, in quanto 
causa, influenzare gli eventi al suo esterno; la radiazione che cade fuori di essa 
viene assorbita. Il processo di formazione del buco nero non può consistere 
nel collasso gravitazionale, cioè nella compressione di una nube di materia 
fino ad una densità con la quale la curvatura dello spazio diventa sufficiente- 
mente grande per la sua chiusura. 


3.3. Dipendenze quantistiche. 


I tratti essenziali della diversità delle descrizioni classiche e quantistiche 
possono essere riassunti nel modo seguente. 

Lo spazio degli stati del sistema quantistico si presenta sempre come uno 
spazio vettoriale complesso % con una distanza, come uno spazio di Hilbert. 
Con maggior precisione, è lo spazio dei raggi {Ay}, XAeC(]M=1), ve I: 
gli stati descritti dai vettori U e X sono fisicamente identici. Perciò vale il 
principio di sovrapposizione: se il sistema può trovarsi nelle posizioni U; e 
ù,, allora può anche trovarsi in qualsiasi posizione del tipo XJ, + ua, 2, pe C. 
Nella fisica classica non c’è niente di simile: una combinazione lineare formale 
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delle posizioni della pallina, che si trova nel punto q, € nel punto 9,, non corri- 
sponde alla realtà macrofisica. (Le note eccezioni quantistiche a questo principio 
sono le regole di superselezione che vietano le combinazioni lineari degli stati 
con differenti numeri quantici, ad esempio, della carica o del numero barionico, 
ma qui non ci si addentrerà in ulteriori particolari). La possibilità della super- 
posizione conduce a una relazione molto particolare di « interdipendenza» de- 
gli stati distinti dell’uno o dell’altro sistema, col risultato che l'osservazione 
macroscopica del sistema in qualunque stato permette di determinare con ben 
definita probabilità il valore delle sue caratteristiche tipiche per qualunque stato. 

Parlando più precisamente, siano A l’operatore dell’osservabile quanto- 
meccanico e ,, y, gli stati nei quali l’osservabile ammette rispettivamente 
valori esatti A, e A,. Allora, misurando A per il sistema nello stato y= a + 
+ax)», si ottiene il valore A, con probabilità |a,}2/ [|], dopo che il sistema si 
è portato nello stato ),; (se è non-singolare). Perciò il processo di misurazione 
del sistema in un determinato momento è il processo della sua preparazione 
in un altro stato. Nella meccanica classica la misurazione non influisce sullo 
stato del sistema. 

Questo modello di misurazione non dev'essere primario nella successiva 
teoria. Dev'essere il riflesso del fatto che si osserva in modo classico lo stru- 
mento di misura, e in modo quanto-meccanico il sistema misurato e, non 
possedendo informazioni dettagliate sulla posizione quantistica dello strumen- 
to, si effettua qualche media lungo il suo spazio degli stati, il quale influenza 
l'introduzione sia dell'operatore A sia delle previsioni di probabilità. Nel 
processo di misurazione si unificano due sistemi, e nella teoria completa si 
dovrebbe seguire il comportamento del vettore degli stati del sistema unificato. 
Tuttavia ciò è possibile soltanto con l’aiuto dell'aggiunta di un terzo macro- 
strumento, necessario per la misurazione del sistema unificato, e qui di nuovo 
sorgono le difficoltà. Hermann Weyl ha confrontato questa situazione con la 
necessità, dimostrata da Gòdel, di una gerarchia di linguaggi formali di potenza 
sempre crescente per approssimare l’idea di verità matematica. 

Se I, X sono gli spazi degli stati di due sistemi quantistici I e II, allora 
lo spazio degli stati della loro unione è contenuto in, ma non necessariamente 
coincide con, X,@I,. In H,®X, ci sono dei vettori «scomponibili » YU ® po, 
con $;€ Î,, che possono presentarsi intuitivamente come stati nei quali «il 
sistema I si trova nella posizione W,, e il sistema II nella posizione y,». Ma 
tutto I,@I, è ben lungi dall’essere formato solo da vettori scomponibili. 
Secondo il principio di sovrapposizione, sono ammissibili anche gli stati del 
tipo y,@da+4® 42, e intuitivamente ciò significa che tale stato del sistema 
«I+II» non può essere descritto assegnando «separatamente» gli stati del 
sistema I e II. Perciò già lo stesso principio di sovrapposizione impedisce di 
osservare I e II come «parti integranti» di I+II, almeno fino al momento in 
cui I e II non interagiranno fisicamente. Dopo la fine dell’interazione («P'elet- 
trone ha attraversato il settore del campo magnetico », ecc.) diventa di nuovo pos- 
sibile in modo approssimativo l'osservazione separata dei sistemi anche se non 
in tutte le situazioni, come mostra il seguente famoso esperimento immaginario. 
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Esperimento di Einstein-Rosen-Podol'skij. Lo si esporrà nella variante di 
Bohm. Nell’istante iniziale si abbia una molecola con due atomi in uno stato 
con spin nullo; lo spin di ogni atomo sia uguale a 4/2, ed essi siano orientati in 
modo opportuno. Disintegrata questa molecola, senza cambiare il momento 
rotatorio, si aspetta fino a che gli atomi separati non cessino d’interagire in 
modo evidente. S'immagini di misurare lo spin di uno degli atomi. Lo spin si 
presenta come una grandezza vettoriale, e gli operatori di proiezione dello 
spin 0,, 0y, 0, su ognuno degli assi non commutano. Perciò in un solo esperi- 
mento è possibile misurare soltanto una delle componenti, ad esempio c,. 
Viene pronosticata soltanto la ripartizione delle probabilità del risultato della 
misura. In virtà della legge di conservazione del momento, la misura attuale 
di 0, per uno degli atomi conduce a predire che il valore di 0, per l’altro atomo 
nello stesso momento è uguale in modulo ed è opposto in direzione, benché 
non vi siano interazioni effettive tra gli atomi. Per di più, non eseguendo la 
misurazione di 0, per l'atomo I, ma soltanto immaginandola per i diversi 
orientamenti dell’asse 2, si potrebbe concludere che l’atomo II «possiede» 
precisi, ancorché ignoti, valori della proiezione dello spin in tutte le direzioni. 
Essi sono precisi perché le misurazioni per l'atomo I non perturbano l’atomo II. 
Ciò contraddice l’ipotesi secondo cui la funzione  dell’atomo II contiene tutta 
l'informazione a proposito di esso, e l'esperimento di Einstein-Rosen-Podol'skij 
era stato ideato anche per dimostrare la completa insufficienza della descrizione 
quantistica. Una precisa analisi quanto-meccanica, tuttavia, dimostra che la con- 
traddizione è presente altrove: nell'ipotesi secondo cui l'atomo II può essere 
osservato come un sottosistema isolato del sistema I-+IIl, benché tra I e II 
non vi sia apprezzabile interazione «di forze». In realtà, le caratteristiche degli 
atomi I e II sono correlate per mezzo del principio di sovrapposizione, che 
non ammette una reinterpretazione classica soddisfacente. 

L'origine dell’universo da una piccola regione di materia superdensa con- 
duce probabilmente alla completa interazione quantistica di tutte le sue parti, 
cioè all’inatteso ritorno a un’antica idea della filosofia orientale. 


Particelle identiche: statistiche di Fermi-Dirac e Bose-Einstein. Sia X lo spa- 
zio degli stati di una particella. Allora lo spazio degli stati H di un sistema 
di x tali particelle è contenuto in I®®, prodotto tensoriale n-esimo dello spazio 
X. Tuttavia quello non coincide affatto con questo in virtà del principio del- 
l’indistinguibilità delle particelle: qualunque permutazione delle x particelle 
non cambia lo stato del loro sistema. Perciò I C3(9% si compone sia della 
parte simmetrica (statistica di Bose-Einstein), sia della parte antisimmetrica 
(statistica di Fermi-Dirac), e in IC non esistono in generale stati che potreb- 
bero essere descritti come l’insieme «j-esimo stato della i-esima particella», 
cioè sono tutti quanti rimescolati dalle trasformazioni di simmetria. Da qui 
deriva l’importante principio di Pauli per gli elettroni dove 30 = A 25 
(prodotto antisimmetrico): nessuna coppia di elettroni in un atomo può tro- 
varsi in uno stesso stato. (Va qui sottolineata un'ulteriore inadeguatezza della 


885 Dipendenza/indipendenza 


lingua naturale per la descrizione del formalismo matematico: si è appena 
osservato che gli elettroni sono indistinguibili, ma si parla di elettroni diversi). 
Il tutto funziona come se i fermioni si «respingessero » l’un l’altro, benché qui 
non sia presente nessuna forza di repulsione (la repulsione elettromagnetica 
delle particelle di ugual carica non è in rapporto con questo fatto: la statistica 
è legata allo spin e non alla carica). Al contrario, i bosoni «cercano di ammas- 
sarsi» nella stessa posizione. I fotoni si presentano come bosoni, e questo mec- 
canismo si trova nell’operazione essenziale del laser di generare una radiazione 
coerente di grande potenza. Senza dubbio qui non sono presenti nemmeno le 
classiche «forze di attrazione ». La specifica interazione quantistica nei sistemi 
di particelle identiche è descritta in termini di simmetria e di superposizione 
delle loro funzioni d’onda y. 


Interferenza delle alternative classiche e integrali di Feynmann. Il principio 
di sovrapposizione riceve un'originale interpretazione nella riformulazione di 
Feynmann per la meccanica quantistica [cfr. Feynmann e Hibbs 1965]. Si 
consideri un sistema classico che sia descritto dall'insieme delle traiettorie 
virtuali E e dal funzionale dell’azione S : E+R. Questo modello è la « materia 
prima» per la successiva descrizione quantistica. Nella teoria quantistica il 
problema non consiste nella separazione classica delle traiettorie ammissibili 
del sistema da quelle virtuali — queste traiettorie classiche non hanno un senso 
proprio nel modello dato, ma nel calcolo dell’ampiezza (a valori complessi) 
di probabilità della transizione da ben definiti stati iniziali a quelli finali. La 
stessa probabilità di transizione è definita allora come il quadrato del modulo 
dell’ampiezza di probabilità. Secondo la concezione di Feynmann, per il calco- 
lo dell’ampiezza di probabilità bisogna considerare su £ il funzionale eîS (qui S 
è misurata nelle unità d’azione di Planck), e integrarlo in un certo senso su 
quella parte delle traiettorie virtuali di E che corrispondono al passaggio da 
un dato stato iniziale ad un dato stato finale. Questa ampiezza, come funzione 
dello stato finale rispetto a uno iniziale non definito, è la funzione d’onda y. 

Si osservi che i concetti di stato iniziale e finale, a differenza della traiettoria 
tra di essi, conservano un senso semiclassico poiché in sostanza si riferiscono 
attualmente almeno a due processi sperimentali immaginari: l’«allestimento » del 
sistema quantistico nella posizione iniziale e l'atto di «misurazione» in quella 
finale. S'è già detto che queste procedure consistono nell’interazione del sistema 
quantistico con strumenti macroscopici, che sono descritti in modo classico. 

Quindi, nello schema di Feynmann, tutte le storie virtuali classiche del 
sistema portano il loro contributo, oltre a ciò nel tipo di struttura del funzionale 
e°S questi contributi interferiscono; ciò conduce anche alla descrizione ondula- 
toria tipica per la meccanica quantistica, ad esempio alla diffrazione degli 
elettroni su un reticolo cristallino. La conservazione degli effetti di diffrazione 
con intensità molto piccole dimostra che le traiettorie classiche possibili di un 
elettrone interferiscono per l'appunto tra di loro, ma ciò non accade per le 
traiettorie classiche effettive di alcuni elettroni, cioè l’ultimo concetto non è 


x 


adeguato alla realtà fisica. Questo è uno degli sviluppi sorprendenti della di- 


29 
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pendenza di tipo non classico che fornisce una buona illustrazione del fatto che 
la dipendenza appare come termine metalinguistico, entrato piuttosto nella de- 
scrizione del modello matematico, che non in quella della modellizzazione della 
| sua realtà. L'effetto d’interferenza è legato al contributo delle traiettorie virtuali 
alla fase, nell’ampiezza di probabilità, ma queste fasi non si presentano anco- 
ra come grandezze fisiche osservate perché non si riferiscono al processo reale. 


3.4. Interazioni termodinamiche. 


La termodinamica ha a che fare con i sistemi formati da un numero molto 
grande di particelle, come in un volume di gas, e studia Ie loro caratteristiche 
macroscopiche. Queste caratteristiche in ultima analisi sono soggette a inter- 
pretazione come medie statistiche nello spazio degli stati microscopici del si- 
stema, e il loro comportamento macroscopico dev'essere interpretato nei mo- 
delli statistici tipo quelli considerati nel $ 2. Ciò è legato a un’intera cerchia di 
difficili e non completamente risolti problemi matematici, e qui ci si limiterà 
alla descrizione qualitativa di una serie di concetti fondamentali. 


Lo spazio degli stati di un sistema grande. Nella variante classica come in 
quella quantistica un modello per lo spazio degli stati è la terna formata dal- 
l’insieme degli stati M, dalla funzione £ : M+R (E(x) è l'energia del sistema 
nella posizione x) e dalla misura p su M. Nel caso di un sistema classico hamil- 
toniano, in qualità di M si assume lo spazio delle fasi, in qualità di p la misura 
di Liouville, che è invariante rispetto al flusso del movimento lungo le traiet- 
torie nello spazio delle fasi. Nel caso di un sistema quantistico, M è spesso 
ritenuto finito benché sia un sistema molto grande, e la misura è la probabilità 
che il sistema si trovi in un dato sottoinsieme di stati. 

Tutta la terna (4, E, yu) può dipendere da alcuni parametri microscopici: 
le misure del serbatoio contenente il gas, il campo magnetico esterno nel quale 
esso si trova, ecc. Questi parametri sono detti esterni. Assegnando i parametri 
esterni e un piccolo intervallo energetico (E, E+3£) si determina un insieme 
di (micro) stati accessibili per il sistema con questi parametri. Su questo in- 
sieme u induce una nuova misura, la probabilità. 

Il sistema è detto in equilibrio se la probabilità di trovarsi in una qualunque 
regione di microstati accessibili non dipende dal tempo. 

Va sottolineata la differenza dal sistema formato dalla pallina nella scanala- 
tura: le sue posizioni di equilibrio sono le traiettorie nelle quali essa è immobile, 
cioè non è mutata nessuna delle sue caratteristiche. Gli stati di equilibrio di 
un sistema grande sono gli stati nel quale sono costanti soltanto le medie delle 
caratteristiche degli stati accessibili. Il gas con una certa pressione, volume e 
temperatura si trova in equilibrio nonostante i complessi movimenti micro- 
scopici compiuti dalle molecole isolate. 


Entropia e temperatura. Si indichi con g(£) la misura del sottospazio degli 
stati con energia <F. La funzione S(E)=log(d9(E)/dE) è detta entropia, 
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e la funzione (d45/dE)! è detta temperatura formale del sistema in equilibrio 
con energia £. L’entropia, come ordine di grandezza, è proporzionale al numero 
dei gradi di libertà del sistema, che è molto grande (si ricordi che il numero di 
Avogadro è dell'ordine di 10?8). 


Interazione termica. Siano I e II due grossi sistemi e li si riunisca in un 
unico sistema con energia totale E*. Si suppone che l’interazione fra le parti 
I e II del sistema unificato abbia luogo grazie allo scambio stocastico delle 
energie in modo che questi atti di scambio quasi non turbino l’evoluzione indi- 
pendente dei sottosistemi I e II nel loro spazio degli stati accessibili. Ciò 
significa che la densità di probabilità, tale che il sottosistema I abbia l’ener- 
gia E ed il sottosistema II l'energia E*—E, è proporzionale a dg, (E)/dE x 
x dpy(E*—E)/dE. Ma con l’aumentare di E il primo fattore cresce molto in 
fretta, e il secondo si abbassa molto in fretta. Quindi questa densità di pro- 
babilità ha un picco molto limitato che corrisponde a un estremo della derivata 
di questa funzione di E, cioè alla condizione di uguaglianza delle temperature 
formali dei sottosistemi I e II. Dal momento che (E) cresce con l'aumentare 
di E, insieme alla sua derivata, come una potenza molto alta di E, la tempera- 
tura formale del sistema è sempre non-negativa. Con l’interazione termica 
dei sistemi, le loro temperature in ultima analisi si livellano; l'energia passa 
dal sistema con una temperatura maggiore al sistema con una temperatura 
minore. Lo stato limite ha un’entropia massima. Dal momento che l’entropia 
è una misura logaritmica del numero degli stati accessibili, e la traiettoria micro- 
scopica nello spazio delle fasi del sistema riempie in modo uniforme il corri- 
spondente sottospazio, l’entropia massima risponde al massimo «stato caotico » 
del microcomportamento del sistema, all’assenza di una strutturazione macro- 
scopica, per quanto ciò sia compatibile con le condizioni esterne. 

Quest’idea conduce a una concezione molto importante per la biologia 
teorica, costringendo a prestare particolare attenzione a come gli organismi 
viventi si conservano e a come conservano la loro complessissima organizza- 
zione strutturale. Stando a Schroedinger, l'organismo «assorbe un’entropia 
negativa» dai generi alimentari e fa uso dell’energia esterna per lottare contro 
i processi termodinamici generali di allineamento termico e di convergenza 
verso un caos omogeneo. Questo risultato è ottenuto a spese dell’aumento 
dell’entropia dell'ambiente immediatamente circostante. Negli ultimi dieci 
anni questo problema ha acquisito un inaspettato valore sociologico nelle que- 
stioni di conservazione dell'ambiente ecologico in cui vivono gli uomini. Lo 
stesso ambiente ecologico naturale è un’entità altamente strutturata e il suo 
inquinamento, provocato dagli scarti della produzione e della vita quotidiana, 
è l’immagine visibile del prezzo per la diminuzione dell’entropia, cioè per 
l’organizzazione della natura sociale tecnologica della società contemporanea. 


Insieme canonico. Si consideri il caso dell’interazione termica di due sistemi 
I e II, dei quali il primo è molto piccolo rispetto al secondo (nel senso del 
numero di gradi di libertà). 
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Il sistema II viene detto termostato se è cosî grande che la sua temperatura 
nell’interazione col sistema I è 7. Dall’osservazione precedente non è difficile 
dedurre che la probabilità di trovare il sottosistema I nello stato di energia E 
è proporzionale a e-£/T, Il fattore di proporzionalità è determinato dalla con- 
dizione che la probabilità totale sia uguale all'unità. (Se la temperatura # è 
misurata in gradi, allora la temperatura 7° è uguale a Az, dove & è la costante 
di Boltzmann). 

L’insieme dei sistemi con equazioni dell’energia {E,} e con ripartizione 
delle probabilità del tipo 


1 
P,=e-E/T (pe) 
s 


è detto insieme canonico. È uno dei modelli fondamentali della fisica statistica 
che rappresenta la classe fondamentale delle interazioni del sistema con l’am- 
biente circostante. 

Si osservi l'analogia formale della «somma statistica» Y}e FT con la «som- 


s 
ma secondo la traiettoria virtuale» di Feynmann Y'e'Ss/. In entrambi i casi nel- 


8 

l’indice degli esponenti si trova una grandezza che misura l’azione, ma nell’in- 
tegrale di Feynmann c'è inoltre l’unità immaginaria che da una parte deter- 
mina l’interferenza delle ampiezze, e dall’altra conduce al problema matema- 
tico straordinariamente difficile della convergenza. Una delle impostazioni per 
una rigorosa definizione e per il calcolo degl’integrali di Feynmann consiste 
nello sfruttare quest’analogia: l’integrale di Feynmann converte la somma 
statistica mediante il lavoro con «un tempo puramente immaginario ». Questa 
sostituzione trasforma lo spazio-tempo di Minkowski nello spazio-tempo 
euclideo a quattro dimensioni. L’analogia con la fisica statistica, la tecnica più 
semplice di lavoro nella teoria euclidea dei campi quantistici, con il collega- 
mento all’idea di prolungamento analitico, è un metodo molto importante 
nella fisica teorica degli ultimi anni. 


Termodinamica macroscopica e interazioni termodinamiche generali. Nella 
fisica classica la termodinamica era stata creata come scienza relativa ai para- 
metri macroscopici dei volumi di gas, sottoposti a influenze esterne che for- 
niscono o prelevano calore e lavoro meccanico. Se ne esporranno brevemente 
i risultati seguendo Truesdell. La giustificazione degli assiomi matematici di 
partenza e la definizione dei parametri macroscopici come medie possono essere 
realizzate con strumenti della fisica statistica a partire dagli stati microscopici, 
nello spirito della precedente esposizione. La differenza del punto di vista 
qui ammesso è ricca di contenuto nel senso che l’ambiente esterno al sistema 
termodinamico non è più considerato come un sistema simile, ma è descritto 
in termini di trasmissione di calore e di lavoro meccanico. 

Lo stato istantaneo del sistema è dato dai quattro numeri (V, 7, p, 0) 
(volume, temperatura, pressione, calore). Il processo è descritto da quattro 
funzioni V(t), T(t), p(#), O($), dipendenti dal tempo ze[f,, i,]. Nella descri- 
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zione del processo reale esse devono essere considerate come proprietà in- 
trinseche del sistema e anche come caratteristiche della sua interazione con 
l'ambiente esterno. Gli assiomi della termodinamica postulano le seguenti re- 
strizioni cui devono soddisfare V, 7, p, Q durante i processi reali. Esse sono 
molto interessanti dal punto di vista matematico. 


a) Equazione di stato. Esiste una funzione continua x(V, 7), con derivate 
parziali continue rispetto a V e 7, tale che p=7x(V, T) in un insieme 
9 di volumi e di temperature. 

b) Calore latente e calore specifico. Esistono funzioni continue con derivate 
parziali continue A, e K,, tali che per qualunque processo 


Q=A,(V, T)V+K,(V, T)T 
(il punto indica la derivazione rispetto al tempo). 


Un processo in cui Q=0 è detto adiabatico, e la curva corrispondente 
nello spazio delle fasi è detta adiabatica. Il processo in cui T=cost è detto 
isotermo, e la curva corrispondente è detta isoterma. 

Il lavoro prodotto dal sistema durante il processo P è uguale a 


fav. T) dV=L(9). 
9 
Le grandezze 


c9-fa 09-i [io 


rappresentano rispettivamente l’incremento netto di calore, il calore assorbito 
dal sistema e il calore ceduto dal sistema durante il processo. 

Il processo è detto ciclo di Carnot se è formato da due adiabatiche che 
uniscono due isoterme, e inoltre O>o (il calore è assorbito) sull’isoterma 
con la temperatura più alta 7+, e Q<o (il calore è ceduto) sull’isoterma fredda 
T-. È possibile dimostrare che esistono delle funzioni £ e h di una variabile, 
tali che per ogni ciclo di Carnot © con temperatura superiore 7+ e inferiore 


T- risulta 
L(0) _g(T*)-g(7>) 
C+(€) h(T4) 


La funzione % è definita con esattezza a meno di una costante moltiplicativa, 
e per una data % la funzione g è definita a meno di una costante additiva. 
Questo risultato deriva dall’assioma di Carnot secondo il quale L (€) dipende 
in modo universale soltanto da T+, T- e da C+(©). Allora per qualunque 
processo ciclico 4 abbiamo 


L(9)= (I î(A, dV+K, dT). 
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Nell’insieme D esiste una funzione E(V, T), detta energia interna del sistema, 
per la quale È=(g/1)O-pV in ogni processo. (Essa dipende da g, X in mo- 
do non essenziale). d 
Ammettiamo ancora che nell'insieme 9 esistano una funzione positiva 
continua f e una funzione differenziabile H tali che H=0/f per 1 processi 
reali. Allora la grandezza g=E—gH è detta potenziale termodinamico del 
sistema. Assegnandolo si definiscono tre funzioni fondamentali che caratte- 
rizzano il processo: l'equazione di stato 7(V, T)=p e A,, K, con le formule 
do ZIA se (E Si 
Rata deco hg ar) 
Per i gas ideali si può porre 4= 7, g= T+cost e Q0= TH dove H è l’en- 
tropia come funzione nell'insieme DI. 


3.5. Stabilità, segnale, informazione. 


x 


Stabilità. Nella concezione di sistema isolato è sottintesa una certa in- 
varianza delle sue caratteristiche nel dominio spazio-temporale della sua esi- 
stenza, che permette soltanto d’identificare questo sistema come tale. In questo 
senso un'idea primordiale di stabilità è già presente nei concetti scientifici 
fondamentali. Tuttavia questo termine è usato più frequentemente in accezioni 
più specializzate con riferimento a) alle caratteristiche degli uni o degli altri 
regimi di evoluzione del sistema, b) alle caratteristiche dei modelli matematici 
che descrivono il sistema. e 

Nell’accezione a) si è usata questa parola in connessione con gli stati di 
equilibrio di una pallina nel fondo di una buca di potenziale. Nell’accezione 
b) il termine è stato usato per la descrizione di quei modelli le cui piccole 
variazioni conducono a piccole variazioni delle caratteristiche previste del 
sistema. È evidente il ruolo peculiare del comportamento dei regimi stabili e 
dei modelli matematici stabili. In particolare la stabilità di un modello è im- 
portante per essere sicuri di poterlo applicare: se una piccola variazione dei 
dati iniziali conduce alla rapida dispersione delle traiettorie del sistema mec- 
canico, come nei flussi geodetici sulle superfici di curvatura negativa, allora 
la descrizione dettagliata delle traiettorie individuali perde senso. Nella realtà 
non possiamo misurare i dati iniziali con precisione arbitrariamente grande; 
oltre a ciò, le fluttuazioni e le deviazioni dal modello idealizzato agiranno per 
tutta la lunghezza della traiettoria. Bisogna ancora separare l’insieme delle ca- 
ratteristiche previste e interessarsi a proprietà statistiche o topologiche delle 
traiettorie, come in termodinamica. . sui 

Bisogna ancora notare l’indeterminatezza del termine ‘piccole variazioni 
del modello’. Spesso viene interpretato come l’introduzione di piccoli para- 
metri in particolari equazioni del modello. Ma gli esempi della teoria della 
relatività speciale rispetto alla meccanica newtoniana («il piccolo parametro 
è v/c») e della meccanica quantistica rispetto alla fisica classica IG il piccolo 
parametro è 4») dimostrano che i modelli fondamentali di diversi livelli non 
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sono affatto ridotti luno all’altro annullando semplicemente il piccolo para- 
metro. Quest'ultimo fatto può essere valido soltanto in una certa regione degli 
effetti previsti da questi modelli; la struttura generale della teoria risulta 
assolutamente diversa, e nelle altre regioni gli effetti possono essere assoluta- 
mente diversi da quelli previsti. 


Instabilità. L’instabilità di alcuni regimi critici di comportamento del 
sistema è alla base degli effetti di amplificazione tipo «meccanismo di discesa». 
Soltanto grazie all’esistenza di tali regimi nei macrosistemi gli effetti micro- 
scopici possono essere amplificati ed osservati. Un famoso esempio della fi- 
sica sperimentale è quello delle tracce delle particelle elementari nella camera 
di Wilson. Tuttavia, fino ed oltre la nascita di un’esperienza fisica, tutto il 
comportamento degli organismi viventi è legato a tale instabilità. La vista e 
l'udito, cioè i canali fondamentali che legano gli organismi superiori al mondo 
esterno, introducono nell’organismo quantità di energia trascurabili in confronto 
al dispendio muscolare nel processo dell’attività vitale. Tuttavia sono proprio 
queste quantità che mettono in moto i meccanismi di caccia del predatore e 
di fuga della preda. Le loro caratteristiche quantitative non hanno nessun ruo- 
lo in confronto a quelle qualitative, come veicoli di segnali o d’informazioni di 
un determinato tipo. L'organismo vivente che sta all'erta appare dal punto 
di vista dalla fisica come un sistema instabile di grado superiore; la sua strut- 
tura più complessa assicura la canalizzazione dei vari comportamenti possibili 
in un andamento biologicamente efficiente, la scelta dei quali viene realizzata 
in base all’integrazione, continuamente variata, del quadro informativo derivato 
da deboli influssi, sia esterni che interni. 

Nella terminologia di Thom la descrizione dettagliata nello spazio delle 
fasi dell’organismo vivente deve continuamente subire revisioni catastrofiche, 
legate alla scomparsa e alla nascita di attrattori, alla modificazione della con- 
figurazione delle regioni di attrazione, al passaggio di attrattori instabili alla 
stabilità e viceversa. 

È molto probabile che l’esistenza stessa di una lingua, la sua struttura e la 
realizzazione delle sue funzioni siano legate alla descrizione delle instabilità 
catastrofiche, quasi «scheletro discreto » del mondo e della sua storia. L'analisi 
di Thom [1974], ad esempio, ha mostrato il legame molto stretto che lega la 
semantica di una grande classe di verbi all’elenco delle «catastrofi elementari» 
nello spazio-tempo a quattro dimensioni. Risulterebbe forse utile, da questo 
punto di vista, l’analisi della semantica del linguaggio matematizzato della 
scienza. 

L'osservazione dei modelli scientifici dimostra che nella maggioranza di 
essi prevale decisamente o l’aspetto continuo della descrizione, legato all’idea 
di regime stabile, o l’aspetto discreto, legato alla regolarità del passaggio at- 
traverso una catastrofe o all’interdipendenza delle catene di catastrofi. 

Estremamente difficile risulta la ricerca di una descrizione sintetica, nella 
quale il regime catastrofico sia analizzato come caso limite sullo sfondo degli 
instabili, ma i regimi stabili a un livello più dettagliato di osservazione si pre- 
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sentino come medie di quelli catastrofici. Tali sono, in senso lato, i problemi 
del cambiamento di fase nella fisica statistica, il legame tra la concezione della 
teoria quantistica dei campi e le matrici di dispersione, e Ja maggior parte dei 
problemi della biologia, in particolare della biologia dell'evoluzione. 


3.6. Considerazioni su modelli non fisici. 


Da quanto detto in precedenza dev'essere chiaro che lo studio della vita, 
dai virus agli uomini, nella misura in cui può essere fondato sulle idee tradi- 
zionali della fisica, deve in un modo o nell’altro essere messo in relazione con 
il complesso delle idee relative ai sistemi chiusi. Gli elementi di tale studio 
- come il gene, la cellula, l'organo, l’organismo, l’organismo indipendente, 
l'individuo, la società ecologica, il collettivo, ecc. — sono considerati inizial- 
mente come sistemi potenzialmente isolati. Si esamineranno ora in modo molto 
generale alcune loro analogie e differenze con i sistemi fisici. 

Le idee relative alla descrizione nello spazio delle fasi degli stati stabili, 
e spesso relative anche alle caratteristiche termodinamiche del sistema, sono 
applicate con successo quando il numero dei gradi di libertà osservati non è 
grande, oppure quando esso è grande ma i gradi di libertà sono abbastanza 
omogenei da rendere possibile un’osservazione statistica. Tali sono i modelli del- 
le associazioni ecologiche secondo Volterra [1931] e i suoi seguaci, i modelli 
economici, le analisi statistiche della società secondo un parametro che interessi 
le compagnie di assicurazione e le attività politiche. La possibilità d’isolare 
un piccolo numero di gradi di libertà con la «compressione» dei rimanenti è 
largamente applicata agli esperimenti fisiologici e psicologici che permettono 
di analizzare con precisione la canalizzazione della reazione, cioè le traiettorie 
del sistema in uno spazio delle fasi di grandissima dimensione, costrette a 
trovarsi in un sottospazio di dimensione piccola in virti di limitazioni esterne. 
Questo è il tipico metodo di lotta contro la principale instabilità dei sistemi 
biologici ricordata sopra, che permette di studiare separatamente i diversi 
canali concepibili del comportamento a spese dell’improvvisa limitazione di 
questa instabilità («cani di Pavlov»). Le leggi di conservazione o le loro varianti 
approssimative possono essere le conseguenze delle limitazioni fisiche corri- 
spondenti: l’energetica, le risorse economiche, le potenzialità delle vie di co- 
municazione e dei mezzi di trasporto limitano in gran parte l'ambito del pos- 
sibile per una società ecologica, o le nazioni in stato di guerra e pace. . 

Esiste tuttavia per lo meno una proprietà generale dei sistemi qui osservati 
e che non trova quasi corrispondenza nei comuni modelli della fisica. Questa 
proprietà limita l’attività del sistema biologico in rapporto al mondo esterno. 
L’apparato genetico della cellula è molto fortemente isolato da influssi esterni; 
la sua funzione consiste, anzi, nell’organizzazione attorno a sé della struttura 
complessa di un organismo vivente. L'organismo indipendente umano si di- 
fende con tutti i mezzi dagli influssi dell'ambiente esterno che escono dai 
limiti di un piccolo intervallo di temperatura, pressione, accelerazione, per la 
conservazione dell’omeostasi interna. Tuttavia esso compie una ricostruzione 
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molto precisa dell'ambiente del suo habitat. L'attività di un fermento che 
affretta in modo selezionato una reazione fra le molte possibili nelle sue vici- 
nanze, e quella di una persona che ha costruito la cattedrale di Chartres o una 


‘ macchina calcolatrice, hanno molto in comune tra di esse, e quasi niente in 


comune con il comportamento dei sistemi standard dei quali si occupa la fisica. 
La strutturazione direzionale della descrizione nello spazio delle fasi delle sue 
immediate vicinanze è, insieme al suo isolamento da influssi inversi, la pro- 
prietà più caratteristica dei sistemi che interessano il biologo, lo psicologo o lo 
storico. Il problema della comprensione di tale comportamento, probabil- 
mente, sarà sempre la massima sfida all’intelletto, tendente a capire la sua di- 
pendenza dall’universo e la dipendenza dell'universo da sé. [Ju. 1. M.]. 
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La nozione di dipendenza/indipendenza è un’idea metateorica generale con un am- 
plissimo spettro di realizzazioni concrete. Come si è visto, si tratta di individuare un certo 
nucleo di concetti collegati alla descrizione della coppia dipendenza/indipendenza all’in- 
terno di alcuni modelli (cfr. modello) della fisica teorica. Dato che questa scienza utiliz- 
za la matematica come linguaggio di lavoro, i concetti generali di relazione e di funzione 
(cfr. funzioni) sono analizzati in rapporto alla teoria degli insiemi (cfr. insieme), la 
dipendenza lineare, quella algebrica e funzionale (cfr. divisibilità, razionale/algebri- 
co/trascendente) e specificazioni più complesse del concetto (cfr. dualità), fino alla 
dipendenza nei gruppi non commutativi e al «problema dell’identità delle parole» (cfr. 
algoritmo). Si pongono in luce i legami con fenomeni generali d’indecidibilità (cfr. 
assioma/postulato, logica) e questioni di dipendenza nel campo della probabilità. 

L’astrazione che più di ogni altra esprime nella scienza moderna l’idea di dipen- 
denza/indipendenza è la concezione dei sistemi chiusi (cfr. sistema), concetto fonda- 
mentale per l’elaborazione di « leggi della natura» (cfr. legge), con le necessarie distin- 
zioni fra il supporto discreto delle formule matematiche e la componente infinita, con- 
tinua, variabile delle condizioni iniziali e della condizione al contorno (cfr. analisi/sin- 
tesi). Il principio di minima azione (cfr. differenziale, variazione) è di fondamentale 
importanza nella descrizione matematica dei sistemi isolati e viene illustrato con un esem- 
pio già trattato in continuo/discreto adatto a rappresentare i concetti principali dei si- 
stemi chiusi. Questi concetti vengono poi riproposti nella loro generalità con l’aiuto di 
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strutture geometriche e topologiche (cfr. geometria e topologia, applicazioni). Si pon- 
gono in luce i legami tra le leggi di conservazione (cfr. conservazione/invarianza) 
fondamentali e la simmetria dei sistemi, e si esamina da questo punto di vista la teoria 
della relatività. 

L'esempio dell’oscillatore lineare mostra come la descrizione matematica della cau- 
salità (cfr. causa/effetto) sia legata alla comparsa di funzioni analitiche. Un ulteriore 
esempio di sistemi chiusi è l'universo, descritto come modello cosmologico (cfr. teoria/ 
modello, caos/cosmo) attraverso il concetto di varietà quadrimensionale con metrica 
pseudoriemanniana. 

Il concetto di dipendenza è formulato anche in riferimento alla meccanica quantistica 
(cfr. atomo e molecola, particella) e alle interazioni termodinamiche (cfr. entropia, 
equilibrio/squilibrio, controllo/retroazione). 

L'importanza della stabilità (cfr. stabilità/instabilità) è implicita nella considera- 
zione dei sistemi isolati, mentre l'instabilità di alcuni regimi critici di comportamento è 
alla base degli effetti di amplificazione di tipo « meccanismi di difesa» (cfr. catastrofi). 


Divisibilità 


In aritmetica elementare ‘divisibilità’ di un numero naturale a per un nu- 
mero naturale è significa l’esistenza di un numero naturale c tale che a= be. 
Nella teoria del continuo dei numeri reali la divisibilità illimitata interviene quale 
possibilità, per ogni numero reale « e per ogni numero naturale è, di costruire 
un numero reale } tale che 58 =. Nel linguaggio geometrico ciò significa che 
ogni segmento può essere diviso in un qualsiasi numero di parti uguali. In ge- 
nerale la divisione è l'operazione (parziale) inversa della moltiplicazione — clas- 
sicamente, moltiplicazione per numeri interi —, operazione quest’ultima che equi- 
vale a sommare più volte una stessa quantità e che è ammissibile per quantità 
del genere più diverso (lunghezze, aree, volumi, pesi, ecc.). Dopo che la com- 
prensione delle proprietà astratte della moltiplicazione ebbe permesso d’indivi- 
duare il prodotto quale struttura che ammette diverse realizzazioni, si comin- 
ciò a chiamare divisione l’operazione inversa del prodotto negli anelli, nei mo- 
noidi, nei moduli, ecc. Là dove la divisione non è sempre possibile, la divisi- 
bilità diventa una relazione importante, non banale. Su un piano più generale, 
alla teoria della divisibilità si può far risalire una parte notevole dell’algebra 
(commutativa), nella quale si studia in forma astratta l’interazione tra somma 
e prodotto. Infine, sin dai tempi della filosofia naturale dell’antica Grecia viene 
discusso il problema della divisibilità della materia, dello spazio, del tempo e 
la correlazione tra le proprietà del continuo geometrico divisibile e omogeneo 
e le proprietà della realtà fisica. A ciò si riconducono, in particolare, tutte le 
teorie atomistiche. 

Questo articolo è dedicato prevalentemente agli aspetti algebrici e di teoria 
dei numeri della divisibilità. Nella sua parte elementare la teoria della divisi- 
bilità è contemporaneamente cosi semplice e cosi ricca di contenuto che si ri- 
porteranno qui alcuni risultati fondamentali con le dimostrazioni. Queste, nella 
maggior parte dei casi, si basano sul famoso algoritmo di Euclide per la divisio- 
ne con resto, che è applicabile non solo a coppie di numeri interi, ma anche a 
qualsiasi coppia di numeri reali, o segmenti. In questa variante geometrica la 
divisione con resto non è altro che l’idealizzazione del procedimento fisico di mi- 
sura di lunghezze con una unità di misura rigida. Perciò una successione di 
divisioni con resto è l’anello di congiunzione tra i procedimenti per contare 
grandezze discrete e misurare grandezze continue. Qui è d’importanza fonda- 
mentale l'assioma di Archimede, secondo il quale una quantità, per quanto 
piccola, ripetuta un numero sufficiente di volte, fornisce una quantità grande a 
piacere, (Nella moderna teoria della divisibilità si è condotti a considerare altre 
nozioni di «piccolezza», per le quali l’assioma di Archimede non è più vero; 
cfr. $ 5). 

In tal modo nella teoria dei numeri reali si introduce lo strumento delle fra- 
zioni continue e lo studio della struttura fine del continuo (cfr. $ 3). 

Nell’aritmetica dei numeri interi otteniamo la teoria del massimo comun 
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divisore e della scomposizione in fattori primi. I risultati (in misura minore i 
metodi) sono un modello per la teoria dei numeri algebrici e, con la chiari- 
ficazione della nozione di ideale, per i concetti algebrico-geometrici. In questi 
ultimi si sfrutta il profondo parallelismo tra numeri e funzioni, divisibilità per 
un numero primo e annullamento in un punto; parallelismo che nel presente 
articolo sarà solo toccato nell'esempio elementare numeri interi - polinomi. 

Infine sono da notare i problemi della geometria diofantea (soluzione di 
equazioni indeterminate in numeri interi), la quale, da secoli, è sorgente di pro- 
blemi ed è la pietra di paragone dei metodi della teoria dei numeri. Nei suoi 
risultati entrambi gli aspetti della divisibilità, numerico e funzionale, sono di 
pari importanza. 


I. Teoria elementare della divisibilità e numeri primi. 


1.1. Divisione con resto. 


Siano 4,540 due numeri reali. Esistono allora un numero intero g e un nu- 
mero reale 7 tali che a=bg+7, o<r<|b|. Di più, g e 7 sono unici. Il numero 
q si dice quoziente (incompleto, o parziale) della divisione di @ per d; r si dice 
resto; è è il divisore, a il dividendo. 

Non è difficile dedurre geometricamente l’esistenza e l’unicità di g, r. Per 
a, b positivi, q è il massimo numero di volte che il segmento di lunghezza è è 
interamente contenuto nel segmento di lunghezza a, mentre r è la parte del seg- 
mento 4, minore di 5, che rimane dopo di ciò. (Per a<0, b>o il numero g<0 
è il massimo con la proprietà a=bg, cioè |a|< b|g|: il segmento di lunghezza 
|a] è ricoperto da |g| segmenti di lunghezza è, ma non da un numero inferiore). 

Per la teoria della misura è essenziale che @, d, 7 possano designare quantità 
di natura indeterminata: la possibilità di confrontarle per mezzo della divisio- 
ne con resto, o, secondo Eudosso, mediante l’approssimazione di rapporti di 
numeri interi, segue da alcuni assiomi che qui non formuleremo esplicitamente. 

Se r= o, a è interamente divisibile per è; il risultato della divisione, g, è 
la misura della quantità 4, quando come unità di misura si assuma la quantità 
b. Le quantità @, è (per esempio, segmenti) sono commensurabili se, per un 
opportuno intero p, la quantità pa è interamente divisibile per d. Affermazione 
equivalente: il rapporto tra le misure di a e di d è razionale. Quando « e d sono 
interi ed a è interamente divisibile per b, è si dice divisore di 4; notazione b |a. 


1.2. Algoritmo di Euclide. 


Sia, come sopra, a=bq+r, o<r<|b|. Se r>o, si esegua la divisione con 
resto di è per r: b=rg,+71. Se r,>o, si esegua la divisione con resto di r per 
Y,: Y=T1fo+f9; e cosi. via. Questo procedimento di divisioni successive con 
resto si chiama algoritmo di Euclide: il divisore e il resto del passo precedente 
diventano rispettivamente dividendo e divisore al passo successivo. L'algoritmo 
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si ferma se e quando il resto è uguale a zero. Per questo è necessario e sufficien- 
te che a e d siano commensurabili. Tutta la successione dei quozienti parziali 
della divisione di a per d definisce lo sviluppo di ab-! in una frazione continua 
(cfr. $ 3.2). 

In particolare, l’algoritmo si ferma sempre se @ e 5 sono numeri interi. 
L'ultimo resto non nullo nella divisione di a per b è il massimo comun divisore 
di a e b: il massimo numero reale per il quale siano interamente divisibili 4 e d. 
Questa nozione è della più grande importanza quando a e 5 sono interi. Prima 
di studiarla nei particolari, diciamo ancora alcune parole sull’aspetto compu- 
tazionale dell’algoritmo della divisione. 

Questo aspetto si esaurisce nella descrizione del procedimento fisico idea- 
lizzato che, nella variante geometrica, consiste nel riportare un segmento su di 
un altro segmento. Nella variante algebrica l'algoritmo della divisione diventa 
realmente possibile solo in un sistema di numerazione sufficientemente svi- 
luppato. Già la scrittura di un numero intero, ad esempio nel sistema decimale, 
contiene l'informazione sulla divisione con resto di questo numero per una po- 
tenza di dieci. L'algoritmo della divisione nella scrittura decimale (quello che 
si impara nei primi anni di scuola) è già di per sé un’importante scoperta di 
teoria dei numeri, ma secondaria rispetto al significato della divisione, che è 
indipendente dal sistema di numerazione. Da questo punto di vista il linguaggio 
geometrico dei Greci è più adeguato all’aritmetica teorica che non i comodi si- 
stemi di calcolo dei tempi più recenti. 


1.3. Massimo comun divisore. 


Siano a,b340 due numeri interi. Un numero intero d>o si dice divisore 
comune di a, è se d|a e d|b. Un numero intero d>o si dice massimo comun 
divisore di a e d se esso è divisibile per ogni loro divisore comune. Se un tale 
numero esiste, esso è unico. 

Mostriamo che il massimo comun divisore di a e d esiste e si rappresenta 
nella forma ax+by con opportuni numeri interi x, y. Infatti, indichiamo con 
d il più piccolo numero intero positivo della forma ax+by, ad esempio d= ax + 
+byo, e mostriamo che @ e d sono divisibili per d. Dividiamo a per ax0+byg 
con resto; otteniamo a=(2x,+by,)g+r. Da cui si ricava r=a(1—qx)+ 
+5(-9y) con o<r<d—1. Cioè r si rappresenta nella forma ax+by, non è 
negativo ed è minore di d; perciò r=0, cosi che a è divisibile per d. Analoga- 
mente si dimostra che è è divisibile per d. 

D'altro lato, se dj a e dold, dy divide qualsiasi numero della forma ax+ 
+6y; in particolare 4. Perciò d è il massimo comun divisore di a e 5. Non è 
difficile verificare che la definizione data in questo punto coincide con quella 
data nella descrizione dell’algoritmo di Euclide, cioè che l’ultimo resto non nullo 
effettivamente coincide con 4. A partire da 4 e percorrendo a ritroso i passi di 
questo algoritmo, si trova la soluzione esplicita dell'equazione d=ax-+by. No- 
tazione abbreviata: d= McD(a,b5), oppure d= (4,8). 

Se (a,b)=1,.i numeri a e d si dicono primi tra loro. 
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1.4. Numeri primi. 


Un numero intero f>I si dice primo se ogni suo divisore positivo è I, 
oppure p. I primi numeri primi sono: 2, 3, 5, 7, II, 13, ».. Ogni numero intero 
a è divisibile almeno per un numero primo: il suo pit piccolo divisore, maggiore 
di 1, è primo (altrimenti un divisore di questo divisore, diverso da esso stesso 
e da 1, sarebbe pi piccolo). l : . 

Da qui segue in primo luogo che ogni numero intero a>1 si scompone in 
un prodotto finito di numeri primi: ciò è vero per 4=2 €, se ciò è già stato di- 
mostrato per tutti i numeri minori di a, ne segue che a sì scompone in a=f X 
x (decomposizione di ap-!), dove p è un divisore primo di a. 

In secondo luogo segue che i numeri primi sono infiniti. Infatti, per ogni 
insieme finito di numeri primi f;, ..., f,, ogni divisore primo del numero 
N=py..-Py+1 è diverso da pi, ..., Pn poiché il resto della divisione di N per 
Py + Py è uguale a 1 e non a o. 


1.5. Unicità della decomposizione in fattori primi. 


Siano 91= 2, Pr= 3, f3= 5, ... tutti i numeri primi scritti în ordine crescente. 
Sia a>1 un numero intero e a= pY1pî2... p}t la decomposizione di a in un pro- 
dotto (di potenze) di numeri primi (per a=1 ogni v; è nullo). Mostriamo che 
questa decomposizione è univocamente definita per induzione su a. l 

Per a=1 è evidente. Sia a>2. Consideriamo ancora un’altra decomposi- 
zione: a= p1pYe... pix. Supponiamo che queste decomposizioni siano diverse € 
giungeremo a una contraddizione. » 

Scegliamo è tale che v;%;. Se v;>0 e w;>0, dividendo « per dî, dove v 
è il più piccolo dei numeri v; € w;, otteniamo due diverse decomposizioni del 
numero ap;”, in contraddizione con l’ipotesi che per i numeri minori di 4 la 
decomposizione sia unica. i 

Se invece, diciamo, v;=0, mentre w;>O0, si ricava che a= pit... dix è divi- 
sibile per p; pur essendo v;=0. Dimostriamo che ciò è impossibile per indu- 
zione su v,+...+v>0. Se v,+...+vx=1, esattamente un solo esponente ; 
è uguale a 1; gli altri sono o. Allora p?1...pf#=p; jatÎ, ma p; non è divisibile 
per p;#);, poiché p; è un numero primo e pi# 1. CAR, 

Infine supponiamo che v,+...+v;>1 e che per valori minori della somma 
degli esponenti sia già stato dimostrato che p}1...p}* non è divisibile per p; 
se w;=0. Allora a=pî1...p}x si può mettere nella forma a=bc, dove b>o, 
c>o e b, c non sono divisibili per p;. Dimostriamo che allora neanche aè divi- 
sibile per p,. Infatti, se d, c non sono divisibili per f;, essi sono primi con pi. 
Siano x, y, x', y/ numeri interi tali che bx+p;y=1 e cx +p;y'=1. Moltipli- 
cando queste uguaglianze troviamo: bexx + p;cx'y + pibay' +piyy' =I. Se sì SUp- 
pone che ; divida de, si ricava che p; divide 1 e ciò è una contraddizione. Ciò 
conclude la dimostrazione dell’unicità. Quale corollario non è difficile ottenere 


che, se a=][]pf: e 5= []£ si ha: mcp(a,b)= [] printer, 
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1.6. Numeri razionali. = 


Dal teorema sull’esistenza e l’unicità della decomposizione dei numeri natu- 
rali in fattori primi segue che ogni numero razionale (cioè ogni rapporto tra in- 
teri) si rappresenta in modo univoco sotto forma di frazione irriducibile 4/5, 
oppure — (a/b), dove a=0, d>o sono naturali con (4,5) =1; oppure anche 
nella forma +[]p?, dove, come sopra, dDi=2 Pa=3, f3= 5, -.. sono primi, 
mentre v; sono esponenti interi qualsiasi, dei quali solo un numero finito sono 
diversi da zero. 


1.7. Distribuzione dei numeri primi nella serie naturale. 


Un metodo semplice per formare la tabella dei numeri primi che non su- 
perano N è il seguente. Da una tabella di tutti i numeri interi da ra Nsi can- 
cella 1 (passo zero); poi si cancella ogni numero pari ad eccezione di 2 (primo 
passo); poi ogni multiplo di 3 ad eccezione di 3 (secondo passo) e così via. Se al 
k-esimo passo è stato cancellato ogni multiplo di Das ad eccezione di f7, al 
passo (R+1)-esimo bisogna prendere quale Pira il più piccolo numero, dopo 
Py, non ancora cancellato e cancellare tutti i multipli di Dry ad eccezione di 
Pr+x- 1 numeri non cancellati pi, fs, ... sono appunto tutti i numeri primi. Que- 
sto metodo di setacciare tutti i numeri composti si chiama crivello di Eratoste- 
ne. Le tabelle dei numeri primi rivelano una straordinaria irregolarità nella loro 
distribuzione nella successione naturale. Tutte le nuove generazioni di matema- 
tici compiono tentativi per trovare delle regolarità in questo apparente caos. 
Accenniamo ad alcuni risultati rimarchevoli, benché la loro dimostrazione esca 
dall’ambito della teoria elementare della divisibilità e di questo articolo. . 

Il numero x (N) dei numeri primi che non superano N asintoticamente si 
comporta come N/log N; l’errore non supera cost N log? N. Un Approsunazione 
assai migliore è data dal cosiddetto logaritmo integrale li N =f (1/log.x) dx. 
Il vero ordine dell’errore non è noto: si congettura che esso non sia superiore a 
cx/2+5, con e>o qualsiasi e c=c(e) una costante opportuna. Si ha una for- 
mula esatta per x(N)—liN, la quale si esprime come somma infinita rispetto 
agli zeri della funzione zeta di Riemann %(s): funzione meromorfa nella varia- 


. dI 
bile complessa s, che viene definita per Re(s)>1 mediante la serie De e che 
n= 


poi viene estesa a tutto il piano complesso con uno dei noti e numerosi metodi. 
I suoi zeri non banali giacciono nella striscia critica o<Re(s)<1. La conget- 
tura di Riemann, finora non dimostrata, afferma che essi giacciono sulla retta 
Re(s)=1/2. Questa congettura è equivalente alla stima Im (N )_liN | <cost- 
-NY24€ per ogni e>o. Il legame tra i numeri primi e gli zeri di ie (s) è una delle 
illustrazioni più famose e sorprendenti della sintesi tra continuo e discreto 
nella teoria dei numeri. VALI l 

Se (a,b)=1, in ogni progressione aritmetica ax+b vi sono infiniti numeri 
primi (Dirichlet). Inoltre, asintoticamente il numero di tali numeri < N è ugua- 
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le a (x/@(a)) liN, dove g(a) è il numero degli interi c tali che 1<c<a—-1 
e (c,a)=1 (cfr. $ 2). Pertanto, asintoticamente, i numeri primi sono distribuiti 
uniformemente nelle progressioni. Tuttavia le differenze fra quantità di nume- 
ri primi in due progressioni con uno stesso a rivelano irregolarità di comporta- 
mento sottili e ancora poco comprese. Cosf, nei limiti di tabelle molto lunghe 
di numeri primi, quelli della forma 4r+3 sono sempre più di quelli della forma 
4n+1. Ciò nondimeno è dimostrato che la differenza di queste due quantità 
cambia segno infinite volte. 

Si comportano irregolarmente anche le differenze di numeri primi successivi. 
Dall’asintotica della loro quantità è chiaro che p7. +1; deve oscillare intorno a 
log &, ma l’ampiezza di queste oscillazioni è molto grande e non sono noti 
né il suo estremo superiore, né il suo estremo inferiore. Si congettura che in- 
finite volte si ha px,j—fx==2, ma questo non è dimostrato (problema dei ge- 
melli). 

Fin dai tempi antichi si tentò di trovare una «formula esplicita», cioè una 
funzione di forma semplice, che, per valori interi dell'argomento, desse solo 
numeri primi; tutti, o almeno una parte. Tali tentativi condussero rapidamente 
a una matematica molto ricca. Una soluzione inattesa di tale questione si è 
ottenuta non molto tempo fa. Si è dimostrata l’esistenza di un polinomio in 
più variabili P(x,, ..., x) a coefficienti interi tale che i suoi valori positivi 
nei punti interi x1, ..., x,€Z sono tutti e soli i numeri primi, eventualmente 
con ripetizioni e in un ordine sconosciuto. La stessa cosa è vera, tra l’altro se, 
al posto della successione dei primi, si considera una qualsiasi successione com- 
putabile di numeri naturali, cioè l'insieme dei valori positivi di ogni funzione 
ricorsiva (algoritmicamente calcolabile) da Z, a Z,. Per via della generalità 
di questo magnifico risultato, finora non è stato ancora possibile usarlo per ot- 
tenere nuove concrete notizie sui numeri primi. 


1.8. Numeri perfetti e altro. 


Alla nozione di divisibilità è legata una classe di funzioni aritmetiche, co- 
me t(n) 23, (numero di divisori di 7), dn La (somma dei divisori di x), 
din din 


ecc. È nota tutta una serie di problemi risolti e non risolti sul loro comporta- 
mento. 

Un numero x si dice perfetto se d(1)=2n. Negli Elementi di Euclide è data 
la costruzione di tutti i numeri perfetti pari. La questione dell’esistenza di nu- 
meri perfetti dispari finora è ancora aperta; tale questione, a differenza di al- 
cuni problemi di teoria dei numeri elementari e molto difficili, non ha fatto 
sorgere nuove nozioni o idee che abbiano un qualche interesse. 

Nella teoria analitica dei numeri si studia il comportamento in media di 
funzioni quali t(2), o d(n). Per esempio, asintoticamente abbiamo VETO LO 

5 nZN 


> NlogN. Questa stima e stime più precise si possono ottenere osservando che 
3 t (n) è il numero delle soluzioni in numeri naturali della disequazione xy <N, 
nEN 


cioè il numero dei punti coordinate intere nel primo quadrante sotto l’iperbole 
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xy= N, approssimativamente uguale all’area di questa porzione di piano (limi- 
tata evidentemente dalle disuguaglianze x<N e y<N). In tale genere di pro- 
blemi di solito è relativamente facile ottenere il termine principale dello svi- 
luppo asintotico, mentre problemi sottili sono legati alle stime e alle formule 
esatte dei resti. 


2. Congruenze. 


Sia m>o un numero intero. Allora i resti della divisione dei numeri interi 
per m formano un sistema chiuso rispetto alla somma e al prodotto e al passag- 
gio successivo ai resti. Questo sistema si chiama «anello delle classi dei resti 
modulo m». Il suo studio ha condotto a molte importanti scoperte di teoria dei 
numeri e ha favorito la formazione di una serie di fondamentali nozioni del- 


l’algebra. 


2.1. Definizione dell’anello delle classi dei resti Z/mZ. 


L'anello delle classi dei resti Z/mZ è un insieme con due operazioni, + 
e x, e con due elementi particolari, o mod m e I mod m. 

I suoi elementi sono tutte le progressioni aritmetiche a+mZ={a+mx | 
xeZ}, le quali sono sottoinsiemi di Z. AI posto di a+mZ scriveremo a mod m, 
oppure 4, quando m è fissato e si può tralasciare di ricordarlo. Il numero m 
è il modulo, 4 è la classe dei resti del numero a, a è un rappresentante della 
classe d. I numeri {o, 1, 2, ..., m—1} formano un sistema completo di rappre- 
sentanti, uno per ogni classe se m=I. Per m=0 abbiamo Z/oZ=Z. 

Si dice somma 4+b la classe 4-+5; si dice prodotto dx, oppure sempli- 
cemente db, la classe ab. Le classi a+ e ab non dipendono dalla scelta dei 
rappresentanti 4€ 4, beb, ciò che si verifica con un semplice calcolo. Al posto 
di dj=dy si scrive a,=4, mod m. 

Rispetto alla somma + l'insieme Z/mZ forma un gruppo abeliano (com- 
mutativo) con elemento neutro 5. Rispetto al prodotto, Z/mZ forma un monoi- 
de commutativo con unità î: i 4=4 per ogni d e ab=bda. Il prodotto è di- 
stributivo rispetto alla somma. Perciò Z/mZ è un anello (per le definizioni di 
gruppo, monoide, anello si veda larticolo « Applicazioni» della. presente Enci- 
clopedia, $ 3). Esso consiste di m elementi per m70 e coincide con Z per m=0. 

L'applicazione Z+Z/mZ : a->d è un omomorfismo di anelli. 

Il gruppo additivo dell’anello Z/mZ consiste degli elementi 0, î, i+, ..., 
i+i-+...+1 (m-1 volte), cioè è un gruppo ciclico di ordine m (cfr. $ 4). 

Il monoide moltiplicativo di Z/mZ non è un gruppo per mz1: la classe 3 
non è invertibile. 

Affinché l'anello Z/mZ sia un corpo è necessario e sufficiente che ogni classe 
da sia invertibile, cioè che l’insieme Z|mZ- {3} sia un gruppo rispetto al 
prodotto. Mostriamo che questa condizione insieme con 67î equivale a ri- 
chiedere che #m sia un numero primo. 
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n Se m non è primo, sia m=ab, dove 1<a,b<m. Allora 640, b43, ma 
dab=0. Perciò d e b non sono invertibili e Z/mZ non è un corpo. 

AI contrario, sia 7 primo e 440. Allora m non è divisibile per 4; d’accordo 
con il $ 1, a è primo con m ed esistono x,y€Z tali che ax+my=1 Da cui 
segue che 4#=I, cioè # è l'elemento inverso di d. i 


2.2. La funzione di Eulero. 


Le considerazioni dell’ultimo punto possono essere generalizzate al caso di 
un Tse modulo m e ottenere il risultato seguente: se (a,m)=1, la classe 
d=a mod m è invertibile. Al contrario, se (a,m)=d î E ibi 

"a mo ; =d>1, dà non 
poiché da.md1= 6 e md-146. ui i dai 

Indichiamo con (Z/m2)* l'insieme delle classi d, (a,m)=1. Esse formano 
un gruppo commutativo rispetto al prodotto. Il numero dei suoi elementi si 
Li con (m) e questa si chiama funzione di Eulero (quale funzione di wm). 

€ p è primo, g(P)=p_1; un calcolo diretto mostra che g(p°)=p?(p--1) 
per ogni v=1. Considerazioni un po’ più complesse dànno la formula generale 


k 
P(pIL...Di.) aj dii (pi 1), dove p; sono numeri primi diversi tra loro. In par- 


» ve 
{ i . . 
beta (m,n)=1, si ha p(ma)=0(m)p(n): la funzione di Eulero è molti- 


2.3. I teoremi di Fermat e di Eulero. 


Il teorema di Eulero afferma che, se (a,m)=1, ar =1 mod m. Nel caso 
particolare di m=p primo, si ha il (piccolo) teorema di Fermat: se a non è di- 
visibile per p, aP-!=1 mod p, da cui segue che per ogni 4€Z, aP=a mod p 

; Per dimostrare il teorema di Eulero consideriamo l'insieme {a à, } 
di tutte le classi invertibili. Mostriamo che, se & è invertibile, {dd Lo dig) 
coincide con {ay o dom} (quale insieme, cioè a meno di una petmutazione): 
Infatti 44, è invertibile insieme con d e d,, e Ga,Kdd; per d;#d; (si molti- 


Sii sp ; Lo 
plichi per d la supposta uguaglianza 4d4,= dd;). Perciò dà, ..., ddy(m) CON- 
siste di @ (m) classi invertibili diverse e quindi è (Z/mZ)*. di 
RO i Pm) em) mi 
ui se, i,=||da;=d I. Divi i i 
daq gue che Ja; des am] [a,. Dividendo per la classe inverti- 
. si . . E x 1 
bile []4;, si ottiene: ae i. i 
iI 


2.4. Il teorema di Wilson. 


Esso afferma che, se p è un numero primo, (p--1)!+1=0 mod p 
Per p=2 è evidente. Sia p>3. Se d= 4 in Z/pZ, d=î, oppure i ri 
L equazione @-—i1=0 non ha più di due radici nel corpo Z/pZ, come del re- 
sto in ogni corpo. Ad eccezione di Î e p—1 le altre classi non nulle di residui 
mod p si dividono in (p— 3)/2 coppie (d, d-!) tali che il loro prodotto è î. Perciò 


(p_rl=ip-r)=_1. 
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In realtà il teorema di Wilson ci dà una condizione necessaria e sufficiente 
affinché p sia primo: se m non è primo e d, 1<d<m, divide mm, (m_1)! è di- 
visibile per d e quindi (m—1)!+1 non è divisibile per d e, a maggior ragione, 
non lo è per m. 


3. Frazioni continue e approssimazioni razionali. 


3.1. Approssimazioni razionali. 


La maggior parte dei numeri reali sono formazioni infinite: un numero può 
essere dato, per esempio, mediante le cifre decimali, che formano una succes- 
sione infinita. Praticamente e teoricamente hanno molta importanza le appros- 
simazioni razionali di un numero a, cioè quei numeri razionali (a/b) tali che la 
distanza Ja—(a/b)| sia piccola. Stimiamo l’ordine di piccolezza che si può rag- 
giungere in funzione del denominatore È. ae: 

È sufficiente considerare il caso o<a<1. I numeri razionali con denomi- 
natore d dividono [o, 1] in è intervalli [i/b, (f+1)/b], î=0,..., b-1, di lun- 
ghezza 1/b. Il punto « capita in uno di essi e, indicando con a/b l'estremo di 
questo intervallo pit vicino a «, si ricava |a— (a/b)|<1 [2b. Tuttavia alcuni de- 
nominatori 5, che dipendono da a, permettono di ottenere un’approssimazione 
notevolmente migliore: Ja — (a/b)}<1/b?. l 

Per la dimostrazione consideriamo un numero intero B=1 e tutte le possi- 
bili coppie (a, d) di numeri interi, a>0, b>o, con osba—a<1, b<B. si 
ognuno dei B+1 valori di è vi è un a che verifica la condizione: il più grande 
a per cui a<ba. Perciò esiste i, o<1<B—-1, tale che i due valori bia—a, e 
b,a—a, capitano nell'intervallo [i/B, (î+1)/B], poiché in tutto di tali inter- 
valli se ne hanno B. Ponendo b=b5,—by (se b,>bs) € 4a=4,—4, otteniamo: 
|ba-a|<1/B, da cui ja— (a/b)|<1/Bb<1/b?. 

Questo ragionamento è dovuto a Dirichlet. 

Queste approssimazioni con i numeri razionali particolarmente buone sono 
state usate praticamente. Ecco alcuni esempi. 1 A 

Il classico valore 22/7 è una buona approssimazione di n: 


|r—- (22/7)|<1/7:100. 


La costruzione dei modelli del sistema solare, nei quali il moto dei pianeti 
lungo le orbite viene realizzato mediante trasmissioni ad ingranaggi, richiede 
che si conoscano buone approssimazioni razionali dei rapporti tra i periodi di 
rivoluzione dei pianeti. I numeratori e denominatori di tali approssimazioni 
corrispondono ai numeri di denti degli ingranaggi, 1 quali, per questioni tec- 
niche, non possono essere troppo grandi. Tali approssimazioni sono state tro- 
vate da Christian Huygens che costruf questi modelli. . 

L'esistenza nel sistema solare di grossi pianeti con il rapporto tra i loro 
periodi vicino a 2/5 (Saturno-Giove) ha serie conseguenze cosmografiche: pe- 
riodicamente (ogni ottocento anni) si ha una grande perturbazione del moto 
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medio dei pianeti, la quale può generare instabilità di varie dimensioni. È, que- 
sto, un fenomeno tipico dei modelli matematici della meccanica celeste (« pic- 
coli denominatori» nelle serie della teoria delle perturbazioni). 

Infine, curiose questioni sulle buone approssimazioni sono legate alla storia 
della formazione della scala musicale di dodici suoni, o scala cromatica (Andreas 
Werckmeister, intorno al 1700). 

Le frequenze fondamentali delle corde di un pianoforte accordato forma- 
no una successione finita di numeri soggetta ad alcune condizioni. Prima di 
tutto queste frequenze devono formare una progressione geometrica affinché 
la scala sia uniforme e ogni melodia possa iniziare con un qualsiasi tono (l’u- 
dito percepisce due successioni di suoni come se fossero uguali, a meno dell’al- 
tezza, se i rapporti tra le frequenze dei suoni corrispondenti sono costanti). 
Inoltre, insieme con ogni frequenza, la scala deve contenere quella doppia e 
quella metà (nei limiti dell'intervallo delle frequenze di un dato strumento). 
Ciò è legato al fatto che la frequenza doppia forma l’armonica predominante 
nella corda, complementare alla nota fondamentale, e, per le combinazioni ar- 
moniche, essa deve far parte della scala. 

L’intervallo da ogni frequenza f a 2f forma un’ottava. Esso è troppo grande 
e dev'essere suddiviso in un certo numero & di parti più piccole (che si chia- 
mano semitoni). Il rapporto tra due semitoni successivi in una scala uniforme, 
perciò, deve essere uguale a 2, D'altro lato, le condizioni acustiche per la 
possibilità di combinazioni armoniche richiedono che i rapporti tra le frequenze 
nella scala siano numeri razionali con numeratori e denominatori piccoli: tali 
sono i rapporti fra le frequenze delle armoniche predominanti in un dato to- 
no. Poiché per ogni & il numero 2!/* è irrazionale, queste esigenze sono incom- 
patibili. Bisogna perciò giungere a un compromesso e rinunziare agli intervalli 
puri. La scelta di X=12 è legata all'esistenza di una buona approssimazione 
razionale, 7/12, di log, 3/2, cioè della buona approssimazione, 3/2 (rapporto 
fra le sequenze in una quinta), di 272: 7/12-0,583, log» 3/2-0,585, cosî che 
nella prima ottava (262-524 hertz) la differenza tra le frequenze di un sol ideale 
e reale è inferiore a 1 hertz. 

E cosi si sceglie k=12; la frequenza di (3/2)fo viene sostituita con 27/!2f,; 
per gli altri toni della scala uniforme, 2°, pure si scelgono buone approssima- 
zioni razionali: (9/8)fy=2!%fy (re); (5/4)fo>2"?fo (mi); (4/3)fo2422f, (fa); 
(3/2)fa=2712f, (SOL); (5/3)fo<2!%f1 (la); (15/8)fo 022187, (sì). 

Prima di Werckmeister gli strumenti venivano accordati secondo intervalli 
puri (quinte, terze). Molti, e tra essi Diderot, furono avversi alla nuova scala, 
nella quale non vi sono intervalli puri. Solo dopo il Clavicembalo ben temperato 
di Bach essa ottenne un generale riconoscimento. I principî acustici, di teoria 
dei numeri, che in essa sono fusi, hanno definito in larga misura il carattere 
della musica europea dei tempi moderni. 

Un metodo sistematico per trovare buone approssimazioni razionali è for- 
nito dalla tecnica delle frazioni continue. 
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3.2. Frazioni continue. 


Sia a>o un numero reale. Applichiamo l’algoritmo di Euclide, descrit- 
to nel $ 1, alla coppia (a, 1) e indichiamo i quozienti parziali successivi con 
4, 43, 43, ... (questi sono numeri naturali). Pertanto a=@;+7,, OSr<I; 
I= dt; tra, O<r3<7, (Se 7,70); 11= Agfa +73, OST3<F2 (se 7,760) € cosi via. 
Perciò successivamente si trova: 


a,t =... =Qt 
Fo I 
Ag t— Ag t dt ——_—_ 
ri r3 ag t 
das I 
2 pa 


a=a,t7}=4,t 


L'ultima uguaglianza si verifica se ry=0, cioè nel caso di a razionale. Scri- 
viamo l’ultima espressione nélla forma a = [,; 49, ..., 4]. Essa si chiama fra- 
zione continua di lunghezza & con i quozienti parziali 41, ..., dx. I 

Se a è irrazionale, la successione dei quozienti parziali (a,) non finisce. I nu- 
meri corrispondenti a, = [4;; 43, ..., Qy] si dicono frazioni ridotte di «. Il limite 
di «,, esiste ed è uguale ad a. Perciò si può scrivere a= [a,; 4, dg, ».}, sottin- 
tendendo una frazione infinita. Quale (4,) si può avere una qualsiasi succes- 
sione di numeri naturali. RR 

Definiamo i polinomi universali P,, Q, nelle variabili 4,, 4g, ..., 2 coeffi- 
cienti interi, primi tra loro, mediante le formule Px/Ox= {01 dg, ..., dp] per 
k>1; Po=1, Q=0. Per induzione su £ non è difficile dimostrare una serie 


d’identità per P,, 0,. Per esempio, P,On-1- Pn-10n" (—1)", a=1, da cui 
Pn Pna_ (1° ; 
Q. n Oni On-10n 
D'altro lato, è facile verificare che le ridotte a,=,/9, di ogni «x=0 con in- 


dice n pari sono maggiori di a, mentre quelle con indice dispari sono minori 
(ad eccezione dell’ultima, che è uguale ad a, se « è razionale). Perciò 


Pna 
In1 


I I 
< 


TA Inn Ga 


x 


cosi che le frazioni ridotte sono buone approssimazioni. Si può dimostrare 
che esse sono addirittura le migliori approssimazioni nel senso che lga—p|> 
>|90x— pol per ogni 0<9<go; se, e solo se Po/9 è una delle frazioni ridotte di «. 


3.3. Caratteristica dell’approssimazione e crescita dei quozienti parziali. 


Un numero irrazionale x ammette approssimazioni razionali tanto migliori 
quanto più velocemente crescono i suoi quozienti parziali a;. Per esempio, se 1 
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quozienti parziali sono limitati, la disequazione |x- (p/g)|<c/g* in generale 
non ha soluzioni per c sufficientemente piccolo; se non sono limitati, essa ha 
sempre infinite soluzioni. Sono noti risultati ancora più precisi. 

Perciò è interessante la questione del comportamento dei quozienti parziali 
in funzione del numero «. Essi si annullano a un certo punto, se e solo se a è 
razionale. Essi sono periodici da un certo punto in poi, se e solo se a è un irra- 
zionale quadratico, cioè «={B+yVÎ, con 8, y, è razionali. Per molti irrazionali 
particolari sono note semplici formule per gli a,; per esempio, e=[2; 1, 2,1, 1, 
4,1,1,6,1,1,8,...]. Tuttavia l’autore non conosce un solo esempio di numero 
algebrico di grado superiore a due, per il quale sia noto se è limitata la sua suc- 
cessione di quozienti parziali. Dai tentativi fatti con i calcolatori con numeri 
quali &2, o V2+V3 sembrerebbe che la risposta sia negativa. 

Invece, risultati abbastanza definitivi sono stati ottenuti sul comportamento 
delle frazioni continue «in media», per quasi tutti i numeri « di [o, 1] nel senso 
della misura di Lebesgue (nella quale ogni intervallo è misurabile e la sua mi- 
sura è uguale alla sua lunghezza). Elenchiamone alcuni. L’insieme di tutti gli a 
con gli a, limitati ha misura nulla. Se p,/9, è la n-esima frazione ridotta di «, 
per quasi tutti gli x (cioè per un insieme di misura 1) esiste il limite lim Y7/9, 
ed è uguale a et°/12ln2 (teorema di Lévy-Hinéin). a 

Sia 2, (0)= [0; @n; Gn41: dp49 +] € Sia #1, (x) la misura dell’insieme {a | 2, (0) < 
<x}; allora lim m,(x)=]n(1+)/In2 (congettura di Gauss dimostrata da Kuz- 

N-+00 
min e Lévy). Per quasi tutti gli x il limite lim X/@,...a, esiste ed è uguale a 
î TA 
TK{+1/"(r+2)}M 2 22,6. Invece, il limite i } ai non esiste; quasi ovunque 
1=1 wl 
infinite volte si ha a,>n-Inn. 

Non molto tempo fa si è scoperto che questi risultati sono direttamente in- 
teressanti per la cosmologia teorica. Precisamente, studiando le soluzioni delle 
equazioni della teoria generale della relatività di Einstein vicino alla singolarità 
iniziale — il momento della «grande esplosione » — sono stati scoperti dei regimi 
tipici, di carattere oscillatorio (regimi di Belinskij-Lif$ic-Halatnikov). Ognuno 
di tali regimi è definito da un certo numero «e [o, 1]. Il regime che corrisponde 
a questo numero viene suddiviso in segmenti, che si chiamano ere, le quali sono 
in corrispondenza biunivoca con i quozienti parziali 4, del numero «. L’era 
corrispondente ad a, viene suddivisa in 4, segmentini più piccoli, le epoche. 
Internamente ad ogni epoca la metrica dello spazio localmente evolve appros- 
simativamente come #°?1dx° + 1°?» dy°+1?Psdz?, dove pi +92 td3=P?+p8+p?=1 
(soluzione di Kazner). Insieme con i tre numeri £; sono definiti tre vettori, 
lungo uno dei quali lo spazio si estende, mentre lungo gli altri due si contrae. 
Cambiando epoca, l’asse dell'estensione e quello della contrazione più lenta si 
scambiano, mentre l’asse della contrazione più rapida resta quello precedente. 
Se cambia l’era, varia l’asse della contrazione più rapida, La variazione degli 
esponenti (/1, fs, Ps) si scrive in funzione della frazione continua del numero a. 
Poiché, da un lato, tutta questa descrizione del regime è un’approssimazione 
matematica, e poiché, dall'altro lato, gli stessi modelli considerati possono cor- 
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rispondere solo approssimativamente alla realtà, ne segue che possono avere 
interesse solo le caratteristiche asintotiche dei regimi che hanno luogo per quasi 
tutti i valori di a; in particolare per la presenza delle perturbazioni che rendono 
incerti i valori teorici di « e di 1, Pa) P3- 


4. Aspetti algebrici della divisibilità. 


La teoria della divisibilità dei numeri interi servi come primo esempio non 
banale per una serie di costruzioni algebriche che hanno condotto, da una parte, 
all’aritmetica dei numeri algebrici e, dall’altra, alla moderna algebra commutati- 
va con spiccata influenza della geometria (algebrica). Noi seguiremo l'evoluzione 
e la ramificazione degli aspetti della divisibilità in alcuni esempi fondamentali. 


4.1. Gruppi abeliani. 


La teoria delle congruenze forni consistenti esempi e metodi tecnici per stu- 
diare i gruppi abeliani astratti. Descriviamo i più importanti teoremi strutturali. 

Per i gruppi abeliani useremo la notazione additiva. Un sottoinsieme GCA 
in un gruppo abeliano A si chiama sistema di generatori di A, se ogni elemento 
di A si può scrivere nella forma Y m;g;, me Z, g;e G. Se (Aj)ier è una fami- 
glia di gruppi abeliani, si chiama somma diretta DA; l’insieme dei «vettori» 

iel 

{(a;)ier | 42 A; €, per tutti gli i, ad eccezione di un numero finito, a;= 0} in 
cui l'opposto e l'operazione di somma sono definiti coordinata per coordinata; 
A; è un gruppo abeliano. Invece di AD...DA (m volte) scriveremo Ar. 
îel 


Un gruppo 4 si dice ciclico se in esso vi è un sistema di generatori che con- . 


siste di un solo elemento g. È chiaro che, se tutti gli elementi di {mg | met} 
sono diversi, l'applicazione Z-+ A : m+ mg definisce un isomorfismo di Z su A. 
Se invece non tutti gli elementi mg sono diversi, allora esiste 470 con dg=0 
e tutti questi 4 si dividono per il più piccolo dy; da cui segue facilmente che 
l’applicazione Z/d,Z-+ A definisce un isomorfismo di Z/4,Z su A. Pertanto ot- 
teniamo la classificazione dei gruppi ciclici a meno di un isomorfismo. 

Un gruppo A si dice periodico, oppure gruppo di torsione, se per ogni ele- 
mento ae A esiste meZ, m70, con ma=o. Ogni gruppo periodico finito è 
isomorfo a una somma diretta di gruppi ciclici. Nel caso generale gli ordini di 
questi gruppi non sono definiti univocamente, ma vi sono due tipi di decom- 
posizioni, le quali forniscono invarianti univoci. Prima di tutto vi è la decompo- 


n 
sizione della forma ©Z/d;Z, dove di, ..., dà è una successione di numeri na- 


i=1 
turali univocamente definita tali che d; divide d,,,. (Si chiamano divisori ele- 
mentari del gruppo A). In secondo luogo vi è la decomposizione della forma 


OZ/p5Z, dove p; sono numeri primi e per ogni p; è definita la successione de- 
Îî esponenti 0<r,;<7#;5<...<7;; in modo che solo una quantità finita di nu- 
g P dl 42 iki q 


meri pia sono diversi da 1. Qui la famiglia (p{4) è definita univocamente. 
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Nelle dimostrazioni si usa essenzialmente la seguente circostanza: se m,neZ 
con (m,n)=1, un gruppo abeliano finito A di ordine mn si scompone uni- 
vocamente nella somma diretta dei suoi sottogruppi di ordine m e x. Infatti, 
se mx+ny=1 (x, ye Z) e ac A, si ha: a=mxa+nya, cosi che A=mA®nA= 
=A4,0© 4), dove nA,=mAy= {o}. In particolare Z/mnZ=Z/mZ®Z/nZ. 

Dal teorema della classificazione deriva il seguente criterio di ciclicità per 
un gruppo abeliano finito A: per ogni numero primo g la quantità di elementi 
di periodo q in A non supera g. Applicandolo al gruppo (Z/pZ)*, p-primo, tro- 
viamo che esso è ciclico, poiché il numero di soluzioni dell'equazione 2f—1=0 
nel corpo Z/pZ non può essere superiore a g. Questo è il teorema sull’esistenza 
di un elemento primitivo nel gruppo delle classi dei resti modulo un numero 
primo. Esso è vero anche per i gruppi (Z/p°Z)* per p#2, a21. 

Un gruppo A non ha torsione se da ma=0, dove meZ e ac A, segue che 
m=o, oppure a=0. I gruppi abeliani senza torsione con un numero finito di 
generatori sono liberi, cioè isomorfi a Z7, r=o. Il numero r si chiama rango; 
esso è definito univocamente e coincide con il minimo numero di generatori 
di A. La somma diretta di una famiglia infinita di gruppi Z si chiama gruppo 
abeliano libero di rango uguale alla potenza di questa famiglia. 

Infine, ogni gruppo abeliano A con un numero finito di generatori è iso- 
morfo alla somma diretta di un gruppo abeliano libero e di un gruppo abeliano 
finito. Il rango della componente libera e i divisori elementari del sottogruppo 
di torsione definiscono la classe di A a meno di un isomorfismo. 

Useremo queste conoscenze per descrivere i risultati della teoria della di- 
visibilità in anelli più generali di Z. 


4.2. Proprietà moltiplicative degli anelli e dei corpi. 


Sia A un anello commutativo con identità 1. Le nozioni seguenti generaliz- 
zano direttamente le definizioni del $ 1 che si riferivano ad A=Z. 

Un elemento ae A divide l'elemento be A, se esiste ge A tale che a=bg. 
Un elemento ae A può dividere 1; allora si chiama unità dell’anello. Eviden- 
temente a divide 1 se, e solo sé, 4 è invertibile in A. L'insieme A* delle unità 
è un gruppo commutativo. Abbiamo Z*={+1}; le unità nell’anello Z/mZ 
sono state studiate nel $ 2. Se A è un corpo e A[x] è l’anello dei polinomi in 
una variabile su A, si ha (A[x])*= A*. La stessa cosa è vera per l’anello dei 
polinomi in più variabili A[x,, ..., %n}. 

In un anello A vi possono essere divisori dello zero non nulli; sono tali 
le classi d, 1<d<m, d|m nell’anello Z/mZ. 

Se A non ha divisori dello zero, può essere immerso canonicamente in un 
corpo K, ogni elemento del quale si rappresenta nella forma ab, a,be A, 
b+0. Questo corpo si costruisce, a partire da A, quale corpo delle classi di 
coppie ordinate {(a,5) | 640} con la relazione di equivalenza (4,6) >(a',5'), se 
ab'=a'b. La classe di (a,b) si indica con ab-!; le operazioni si eseguono se- 
condo le ordinarie formule scolastiche. K si chiama corpo dei quozienti del- 
l’anello A. 
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Il corpo dei razionali Q è il corpo dei quozienti dell’anello dei numeri interi 
Z. Il risultato fondamentale del $ 1 si può riassumere cost: il gruppo molti- 
plicativo @* è la somma diretta del gruppo {+1} e del gruppo abeliano libero 
di rango numerabile, liberamente generato dai numeri primi p;. Un elemento 
acQ* appartiene a Z, se e solo se a=t+|]p% con v;>0. 

Gli analoghi dei numeri primi in un anello commutativo A sono gli ele- 
menti non scomponibili, o primi. Un elemento ae A è primo, se non è l’iden- 
tità e se ogni suo divisore è della forma v, oppure au, dove è una unità in A. 
Ogni elemento au si dice associato ad a. Un anello A si dice anello a fattorizza- 
zione unica, se esso non ha divisori dello zero e se il monoide A— {o} (rispet- 
to al prodotto), modulo A*, è liberamente generato dalle classi degli elementi 
primi. In altre parole, scegliamo un elemento p in ogni classe di elementi asso- 
ciati. Allora in un anello a fattorizzazione unica ogni elemento si rappresenta 
in modo univoco nella forma u][p}i, ue 4*, v;>o. 


4.3. Anelli di polinomi e fattorizzazione unica. 


Di tali anelli, oltre a Z, fanno parte &[x] e A[x1, ..., #,]; dove & è un corpo. 
Più in generale, se A è un anello con fattorizzazione unica, ciò è vero anche 
per A[x]. 

La dimostrazione nel caso di [x] e in una serie di altri casi, per esempio, 
per gli anelli di numeri interi gaussiani Z[i]= {a +bV—-1]|a,beZ}, si può ot- 
tenere generalizzando l'algoritmo della divisione con resto. La questione im- 
portante che bisogna risolvere sin dall’inizio sta nello stabilire come si deve 
confrontare il resto con il divisore, affinché questo resto esista e sia definito uni- 
vocamente, 

Nel caso dei polinomi in una variabile su di un corpo, l’uguaglianza a= 59 +7 
definisce g quale quoziente parziale e r quale resto nella divisione di 4 per b, 
se il grado di r è strettamente minore del grado di d (r=0, se il grado di d è ze- 
ro, cioè se d appartiene a A). Con questa definizione la divisione con resto è 
sempre possibile ed è univoca, e per l'anello £[x] si possono ripetere le dimo- 
strazioni del $ 1 (sostituendo l’induzione sul valore del numero intero, con l’in- 
duzione sul grado del polinomio). 

Gli elementi primi dell’anello [x] si dicono polinomi irriducibili sopra il 
corpo A. Per essi, con i metodi del $ 1, si ottengono i seguenti risultati: 

a) Il massimo comun divisore di due qualsiasi polinomi a,bek[x] esiste, 
è definito univocamente a meno di un elemento di &* e si rappresenta nella 
forma au+bv; u,vek[x]. 

b) I polinomi irriducibili (a meno dell’associatività) sono infiniti. Se R=C 
(numeri complessi), tutti i polinomi irriducibili hanno la forma a(x—D), 
ae C*, be C. Se kR=R, i polinomi irriducibili hanno la forma a(x—-b), ac R*, 
be Re ax?+bx+c, ac R*, b,ce R, b*— 4ac<o. Se il corpo k è finito (per esem- 
pio, X2=Z/pZ, p primo), vi è un numero finito di polinomi per ogni grado; 
perciò si hanno polinomi irriducibili di grado grande a piacere. Pit oltre preci- 
seremo questo risultato. 
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Se tutti i polinomi irriducibili in A[x] sono della forma a(x—b), a,beR, il 
corpo È si dice algebricamente chiuso. Condizioni equivalenti: ogni polinomio 
ha una radice in £; ogni polinomio si scompone in fattori lineari in A[x]. 

In questo caso, l’insieme dei polinomi irriducibili, a meno dell’associati- 
vità, è in corrispondenza biunivoca con gli elementi di &. Per &=C, si ha il 
piano complesso. Considerando un polinomio P(x) quale funzione su È, si 
ricava che la sua divisibilità per xa è equivalente al fatto che esso si annuli 
per x=a. 

c) Analogamente alla definizione dell’anello Z/mZ, possiamo definire l’a- 
nello £[x]/Pk[x], dove P è un qualsiasi polinomio (entrambe le costruzioni sono 
un caso particolare di anello quoziente rispetto a un ideale: si veda oltre). Se 
P è irriducibile, R[x]/PK[x] è un corpo K. Il suo grado su È, cioè la sua dimen- 
sione quale spazio lineare su &, è uguale al grado del polinomio P, l’appli- 
cazione canonica £-+K : a+ (classe di a modulo P) è una immersione di corpi. 
Il polinomio P, quale elemento di X [x], non è più irriducibile: da esso si estrae 
almeno un fattore lineare x— #, dove #e K, #= classe di x mod P. Perciò la 
costruzione di K si chiama anche aggiunzione di una radice del polinomio P 
al corpo A. 

Su ciò è basata la costruzione della chiusura algebrica di ogni corpo È, 
cioè di un corpo algebricamente chiuso k e dell’immersione &+k. Per costruire 
k aggiungiamo a 4 una radice per ogni polinomio irriducibile su X e indichiamo 
il corpo cosi ottenuto con k,. Poi, a partire da k,, costruiamo in modo analogo 


ky; a partire da 4, costruiamo il corpo 43 e cosi via. L’unione | Jk; è la chiu- 
sura algebrica di È. o 

Due qualsiasi chiusure algebriche di un corpo & sono isomorfe (mediante 
un isomorfismo che è l’identità su 4, ma in generale non sono identiche). 

d) Sia k=F,=Z/pZ, p numero primo. Si possono ottenere descrizioni assai 
dettagliate dei polinomi irriducibili P nell'anello F,[x] e dei corpi K=,[x]/ 
PF,[x], detti corpi finiti di Galois. 

Sia P un polinomio irriducibile di grado m. Allora il corpo K è di grado 
m su F, e perciò consiste di p” elementi. Le stesse considerazioni svolte per 
dimostrare il teorema di Fermat in Z/9Z mostrano che aP”=a per ogni ae K. 
Applicando questa uguaglianza a #=x modP(x), troviamo che il polinomio 
x" — x è divisibile per P(x) in F, [x]. Poiché x?"—x è divisibile per xP°-—x per 
ogni d | m, si ricava che a?” — x è divisibile pure per ogni polinomio irriducibile 
di grado d|m. Inversamente, se x?" —x è divisibile per un polinomio irriduci- 
bile P di grado 4, allora è d |m. Altrimenti, se r è il resto della divisione di m per 
d, ne segue che x?"— x è divisibile per P, ma allora ciò significa che tutti gli ele- 
menti del corpo F, [x]/PF,[x] sono radici di x?" — x, ciò che non può essere vero, 
poiché il numero di questi elementi è maggiore di p". Abbiamo cosf dimostrato 
che x?"—x=J]P(x), dove i P variano fra tutti i polinomi irriducibili con i 
gradi d|m e con il primo coefficiente uguale a 1: il primo membro si divide 
per il secondo membro; inoltre il primo membro x?” —x non ha fattori mul- 
tipli perché, per esempio, la derivata di x?”—x è uguale a —1. Indichiamo con 
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i(d) il numero di polinomi irriducibili di grado d in F, [x]. Da quanto precede, 
confrontando i gradi, si trova: p"=) di(d). Ciò permette di trovare la fun- 


dim 
zione i(m) nella forma i(m)= z Y u(d) d/d, dove u(d) è la funzione di Mé- 
dim 


bius: essa è uguale a o, se d è divisibile per un quadrato >, e u(p,. Dx) = 
=(-1)f, se f;, ..., Pz sono numeri primi diversi tra loro. 

Non è difficile verificare che i(m)>o per ogni m; in particolare, in F,[x] 
si hanno polinomi irriducibili di ogni grado m. I corpi Fym=F, [x]/PE,[x] 
sono isomorfi per ogni scelta del polinomio irriducibile di grado m. Essi esau- 
riscono tutti i possibili corpi finiti. 

La formula per i(m) risolve in un certo senso il problema della distribuzione 
dei polinomi irriducibili nell'anello F, [x]. Questo problema è notevolmente più 
elementare che quello della distribuzione dei numeri primi in Z € viene risolto 
evitando la funzione zeta. Però, già per le estensioni finite degli anelli F,[x] 
il problema corrispondente diventa molto profondo e viene risolto con mezzi di 
geometria algebrica. Esso è l'oggetto della teoria delle funzioni zeta delle curve 
algebriche e, più in generale, delle varietà algebriche sui corpi finiti. 


4.4. Esempi di anelli con fattorizzazione non unica. 


Uno degli esempi più semplici è fornito dall’anello Z[V—5]={a+2V-5| 
a,beZ}. In esso 21=3-7= (4+V=5)(4-V—5). Qui i fattori non sono scom- 
ponibili, né, a due a due, associati. L'assenza dell’univocità della fattorizzazione 
negli anelli Z[y/1], p=>5, è stata scoperta quale risultato dei tentativi di dimo- 
strare la congettura di Fermat sull’assenza in Z di soluzioni dell'equazione 
aP+yP+2P=o0, xy3z#0. 

Lo studio profondo delle strutture moltiplicative negli anelli di numeri al- 
gebrici, iniziato da Kummer, Dirichlet ed altri, si è accompagnato con lin- 
troduzione nella teoria della divisibilità dell’importantissimo concetto di ideale. 
Intuitivamente si può dire che, negli anelli più complessi di Z le strutture ad- 
ditive e moltiplicative siano più fortemente legate l’una all’altra, e nel concetto 
di ideale questo legame è espresso esplicitamente. 


4.5. Ideali di anelli commutativi. 


In un anello commutativo A si chiama ideale i un qualsiasi sottoinsieme di 
A che: a) sia un sottogruppo additivo in A; b) sia chiuso rispetto al prodotto 
per elementi di A: per ogni ac A, dei, si ha adbei. 

Se i è un ideale in A, imitando la costruzione dell’anello delle classi dei 
residui Z/mZ, possiamo costruire l’anello quoziente Afi. Gli elementi di A/i 
sono i sottoinsiemi a+i={a+b|bei} in A. Invece di ati scriveremo d, 
quando i è fissato; 4 è un rappresentante della classe 4. Si chiama somma 4+d 
la classe a+5 e prodotto db la classe ab. L'indipendenza dalla scelta dei rappre- 
sentanti si verifica come nella teoria delle congruenze. Queste operazioni tra- 
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sformano Afi in un anello; l’applicazione canonica ASA[i and è un omo- 
morfismo di anelli. 

L'ideale i viene ricostruito a partire da @ quale Ker 9 (nucleo di 9), cioè 
quale controimmagine dello Se Afiti=9! (5)={ac A|p(a)=0}. Sed: A-+B 
è un qualsiasi omomorfismo di anelli commutativi, la controimmagine dello 
zero dell'anello B è un ideale in A, e se Y è suriettiva, il diagramma y : 4+B 
è isomorfo al diagramma A-+A/Ker ù. Pertanto la classificazione degli ideali 
in un anello è una variante strutturale della questione categoriale della classi- 
ficazione degli omomorfismi di un anello A. Un ideale i si dice primo, se A/i 
non ha divisori dello zero. Condizione equivalente: da abei segue che aei, 
oppure dei. 

Un ideale ic A si dice principale, se esiste un elemento a€ A, generatore 
di i, tale che i=aA= fab | be A}. La teoria delle congruenze è la teoria degli 
ideali principali nell’anello Z e degli anelli quozienti rispetto ad essi. Mostriamo 
che in Z tutti gli ideali sono principali. Infatti, sia icZ un ideale. Se i= {o}, es- 
so è principale. Se i# {o}, sia @ il più piccolo numero positivo contenuto in 
esso. Mostriamo che i= aZ. Evidentemente iDaZ, poiché i è un sottogruppo 
additivo di Z. Sia ora bei un numero arbitrario. Dividendo è per a con resto, 
si ricava che = d— ag appartiene ad i (bei; aei, perciò age i). Ma osrsa—1; 
poiché a è il più piccolo numero positivo in i, deve essere r=0 e b= ag, cosi 
che iCaZ. Gli ideali primi in Z sono {o} e pZ, p numero primo. 

Analogamente si dimostra che, se & è un corpo, in k[x] tutti gli ideali sono 
principali (si considera nell’ideale un polinomio di grado minore e si dividono 
per esso con resto i polinomi dell'ideale). Gli ideali primi in &[x] sono {0} e 
P(x)k[x], dove P(x) è un polinomio irriducibile. 

La semplicità dell’aritmetica negli anelli Z e k{x] in misura notevole è do- 
vuta all’assenza in essi d’ideali non principali. 

Passando ad anelli più grandi, quali Z[V—5], oppure A[x,, xa], perdiamo 
questa proprietà; per esempio, l'ideale (x,, xs), che consiste dei polinomi in 
R{[x,, xs] con il termine noto nullo, non consiste di tutti i multipli di un solo 
polinomio. 

La complessità della struttura degli ideali fu studiata classicamente in mo- 
do separato nella teoria dei numeri algebrici (per gli anelli del tipo Z[V-5]. 
estensioni finite di Z) e nell’algebra commutativa in geometria algebrica (per 
le estensioni finite degli anelli £[x;, ..., x,]). L'unione degli aspetti di teoria dci 
numeri e di quelli geometrici ha aperto la strada a molti successi ed a prospet- 
tive ancora più ampie, poiché le intuizioni geometriche e di teoria dei numeri 
solitamente sono tra loro complementari. Qui ci limiteremo ad esporre alcuni 
elementi della teoria classica. 


4.6. Caso della teoria dei numeri. 


Un numero complesso «€ C si dice algebrico, se esiste un polinomio f(x) 
con coefficienti interi, del quale a sia radice. Il numero a si dice intero alpe- 
brico, se esiste un tale polinomio con il coefficiente direttivo uguale a 1. 
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Tutti i numeri algebrici formano un corpo Qc C, la chiusura algebrica del 
corpo Q. Esso non può essere generato da un numero finito di elementi su Q. 
Quali approssimazioni si studiano corpi intermedi QCKc9Q, di dimensione 
finita (in quanto spazi lineari) su Q. Sia K uno di tali corpi; O Panello di tutti 
i numeri algebrici interi in esso. Le differenze principali dell’aritmetica in O 
dall’aritmetica in Z sono legate alle unità non banali e agli ideali non principali. 


4-7. Unità in O. 


Prima di tutto in O vi possono essere le radici dell’identità, che formano 
un sottogruppo abeliano finito ug. Il gruppo quoziente O*/uy è abeliano li- 
bero. Il suo rango si calcola in termini d’immersioni isomorfe di K nel corpo 
C dei numeri complessi. In tutto tali immersioni sono x = dimensione di K 
su Q. Di esse siano r, le immersioni in R e 27, le immersioni in € (r, coppie 
di immersioni complesse coniugate). Allora il rango di O*/ug è uguale a 
r,+rg—1 (teorema di Dirichlet). 


4.8. Ideali in O. 


L’insieme degli ideali non nulli in O può essere trasformato in un monoide 
rispetto alla legge di moltiplicazione ij={} x,y, | xx€i, veci} Questo mo- 
noide è commutativo e generato liberamente dagli ideali primi, cioè, per ogni 
i# {o} ha luogo la decomposizione univoca i= p?...p}#, dove i p; sono ideali 
primi. D'altro lato, ogni elemento ac O genera l’ideale principale 40; gli 
ideali 40, 50 coincidono se, e solo se, ab-! è l’identità (oppure a=d=0). 
La decomposizione 20 = pîa...p}x a livello di ideali è l’esatto analogo della de- 
composizione di un numero intero in fattori primi. Però, usare questa decom- 
posizione per concrete indagini di teoria dei numeri nell’anello O (per esempio, 
per dimostrare la non-risolubilità delle equazioni) è notevolmente più difficile. 
Oltre alla presenza delle unità, che, per 77+rs>1, fa sf che la ricostruzione di 
a, a partire dalla scomposizione di @0, abbia infiniti valori, non tutti gli ideali 
bî1...pfe sono principali. Una importante caratteristica della diversità è data 
dal gruppo delle classi di ideali del corpo X, che può essere definito quale 
gruppo quoziente di tutte le espressioni formali [br (divisori, o frazioni di 
ideali) rispetto al sottogruppo generato dai divisori principali (cioè corrispon- 
denti agli ideali 20). Il gruppo delle classi di ideali è sempre finito, ma rara- 
mente risulta banale. 


4.9. Linguaggio della geometria algebrica. 


In geometria algebrica ad ogni anello commutativo A si associa lo spazio 


topologico Spec A, spettro dell’anello A. I suoi punti sono gli ideali primi. 


in A, mentre i suoi insiemi chiusi sono in corrispondenza biunivoca con gli 
ideali radicali di A: a un ideale ic A corrisponde l'insieme chiuso V(i)= 
= {pe Spec A | ppi}; un ideale i è radicale, se da x?ei segue che xei. D’al- 
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tro lato, ogni elemento fe A. viene considerato quale funzione sullo spazio 
Spec A, che assume valori in un insieme variabile: il valore di f nel punto p 
è la classe dei residui di f mod p, considerata quale elemento del corpo dei 
quozienti dell’anello A/p. Queste funzioni sono continue nel senso che l’in- 
sieme degli zeri di ogni funzione è chiuso. La geometria dello spazio Spec A 
è un invariante molto fine di questo anello che rispecchia le sue strutture: sia 
quella additiva che quella moltiplicativa; in particolare, la relazione di divisi- 
bilità. Per meglio immaginare Spec A consideriamo il caso A=C[%,, ...; Xp]. 


4.10. Ideali massimali. 


In generale la topologia in Spec A è fortemente non separata; in partico 
lare, in essa vi sono sottoinsiemi con un solo punto (o semplicemente punti) 
non chiusi. Un punto pe Spec A è chiuso se, e solo se, l'ideale primo pc 
è massimale, cioè se ogni ideale intermedio tra p e A coincide con p, o con A. 
In Cla ..+) Xp] tutti gli ideali massimali sono della forma (x1—a, ..., Xn —%n) = 


ZL AG —a;), dove x;e C sono costanti arbitrarie. Perciò lo spettro massi- 


male dell’anello A è lo spazio affine C"= {(a,, ..., an )|x;eC}. (Un'afferma- 
zione analoga è vera sostituendo a C un qualunque corpo £ algebricamente 
chiuso). 


4.11. Insiemi chiusi. 


In SpecC|[ax,, ..., xy] ogni insieme chiuso coincide con la chiusura dell’in- 
sieme dei punti chiusi in esso contenuti. A loro volta, questi insiemi chiusi di 
punti sono sottovarietà algebriche, cioè soluzioni di sistemi di equazioni della 
forma {F;(x,, ..., x, )= 0}, dove F; sono polinomi. Tutto ciò significa che l’arit- 
metica dell’anello dei polinomi coincide, o, piuttosto, è duale della geometria 
delle varietà algebriche nello spazio a x dimensioni. 


5. Aspetti topologici della divisibilità. 


Per m molto grande l’anello Z/mZ è «vicino» all’anello Z nel senso che la 
somma e il prodotto delle classi dei resti dei numeri naturali non molto grandi 
(<m/2 per la somma; <vV7 per il prodotto), si esegue come per questi stessi 
numeri naturali: il resto mod m è banale. Ma è più comodo lavorare con l’anel- 
lo Z/mZ che non con Z, poiché esso è finito e tutte le questioni, per principio, 
si risolvono mediante procedure finite. Su ciò è basata la dimostrazione della 
non-risolubilità di molte equazioni diofantee, quale conseguenza della non- 
risolubilità delle corrispondenti congruenze. 

Per esempio, se 7=3 mod 4, x non è somma dei quadrati di due numeri 
interi: i quadrati modulo 4 hanno resto o, oppure 1 e la somma di due qua- 
drati non può dare resto 3. 
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Entro certi limiti un'idea analoga, la sostituzione di un dominio infinito con 
uno grande ma finito, con successiva estensione periodica, viene spesso usata 
in fisica (per esempio, nella teoria del corpo rigido, nella teoria di Dirac delle 
radiazioni, ecc.). La questione su come si possa formulare quest'idea in un 
apparato matematico consistente non è banale e si risolve in modi diversi. 
Nella teoria dei numeri essa fu risolta costruendo i corpi di numeri p-adici, le 
loro estensioni, e cosf pure costruendo gli anelli di ideli e di adeli, nei quali 
topologia e aritmetica formano un tutto indivisibile. 


5.1. Numeri p-adici. 


Fissiamo un numero primo p. Introduciamo nell’anello dei numeri interi 
Z la topologia, nella quale un insieme UCZ è aperto se per ogni elemento 
ae U esiste un numero intero k=>o tale che a+p*Z CU. E facile vedere che la 
somma, il prodotto e l’inversione di segno sono continui in questa topologia. 
In essa una successione (a,) CZ converge ad a€ Z, se a-— a; è divisibile per una 
potenza di p che cresca indefinitamente con A. Per esempio, nf +0 per n+ co. 
Questa topologia si chiama p-adica. . 
Il gruppo Z non è completo in questa topologia: esistono successioni di 
Cauchy che non hanno limite in Z (per esempio, ag =1+p+...+p*). Cosf 
come si costruiscono i numeri reali a partire dai razionali, definiamo l’anello 
Z,, quale completamento p-adico dell’anello Z. Un suo elemento è la classe delle 
successioni di Cauchy nella topologia p-adica di Z, modulo le successioni che 
convergono a zero. Somma e prodotto delle classi si definiscono coordinata 
per coordinata. L'applicazione a+ (classe (a, ..., 4, ...)) definisce l'immersione 
Z-+Z,. Nell’anello Z, la topologia p-adica è definita esattamente come quella 
in Z (sostituendo Z con Z,). Rispetto a questa topologia Z, è completo: ogni 
successione di Cauchy ha limite. Il sottoanello Z è denso in Z,: la sua chiusura 
coincide con Z,,. è 
Gli elementi di Z,, si chiamano numeri interi p-adici. L’immersione Z-Z, 
induce un isomorfismo degli anelli delle classi dei resti Z/pZ>Z,/pZ,. Sce- 
gliamo in Z (oppure in Z,) un sistema arbitrario R di rappresentanti delle classi 
dei residui modulo p. Allora ogni numero intero f-adico si rappresenta in 
modo univoco mediante una serie )' a,p° convergente in Z,. 
dick 
L’aritmetica in Z, è semplice. I numeri non divisibili per ), e solo essi, 


sono invertibili. (Infatti, 14 pa, con ae Z,, è invertibile: (1r+pa)1= > (—1)aipî. 
0 


I numeri interi è non divisibili per pf sono invertibili: se bx+py=1, x,y€Z, 
si ha: bx=1-—fy invertibile e, quindi, è è un divisore dell’unità. Infine, ogni 
numero ceZ,, non divisibile per p, si rappresenta nella forma d(1+a), dove 
beZ, aeZ,). Ogni ideale in Z, è principale; esso è generato da una certa po- 
tenza p°, :>o, oppure è {o}. Per ogni : si ha l’isomorfismo Z/p'Z3Z,/p'Z,. 

Il corpo dei quozienti Q, dell’anello Z, si chiama corpo dei numeri p-adici. 
Esso si potrebbe ottenere direttamente quale completamento del corpo Q nella 
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topologia p-adica, definita analogamente. È facile vedere che Q,=U DL 
20 


Il vantaggio di Z, e Q, rispetto agli anelli Z/p°Z consiste nell’assenza di divisori 
dello zero e nella presenza di una topologia che permette di applicare mezzi 
d’indagine analitici. (Un esempio semplicissimo: definiamo il logaritmo p-adico 
si : i 
mediante la serie log x=)"(—1) ae essa converge per x€1+pZ, e l’ap- 
co) 

plicazione log : (1+Z,)*-+Z,, p>2, definisce un isomorfismo di gruppi to- 
pologici). 

Questa topologia ha due caratteristiche che la distinguono dalla ordinaria 
topologia del continuo reale: essa è non-archimedea e totalmente sconnessa. 

Dire che una topologia non è archimedea significa che, se x eZ, è un ele- 
mento piccolo nel senso p-adico, ogni suo multiplo intero ma è altrettanto pic- 
colo (cioè è divisibile per una potenza di p non inferiore). Più esattamente, l’a- 
nello Z, (0 il corpo Q,) è dotato di una ultrametrica. Ponendo, per xe pP'D3, 
||, =-*, si ricava che l’applicazione | |, : Zy-+R è una norma p-adica con 
le proprietà seguenti: a) |x|,=0, se, e solo se, «= 0; 5) |aB|,= |a|p{Blps 6) la+Blp 
<max([x|,, |B],) (viene cosi rafforzata la disuguaglianza triangolare; da qui il 
nome di ultrametrica per | |,; per l’ordinario valore assoluto, o per il modulo 
dei numeri complessi, si ha |x+8| <[x|+]B]). Ciò semplifica molti aspetti del- 
l’analisi p-adica. Per esempio, la serie Vai, ax;€Q,, converge se, e solo se, 
la;lp 0. 

Il fatto che le topologie in Q, e Z, siano totalmente sconnesse significa che 
vi è la possibilità di rappresentare ogni sottoinsieme chiuso come unione di 
due sottoinsiemi chiusi disgiunti. In altre parole, le componenti connesse mas- 
simali in Q, e Z, sono i singoli punti. Ciò complica la teoria delle funzioni ana- 
litiche p-adiche, poiché rende inapplicabile l’ordinaria definizione del prolun- 
gamento analitico: il teorema dell’unicità del prolungamento di un germe di 
una funzione analitica secondo la definizione ingenua è falso senza speranza. 
Per questo una analisi p-adica globale è stata formulata solo negli anni recen- 
ti, quando la geometria algebrica e analitica hanno dato modelli di teorie nelle 
quali gli aspetti geometrici e analitici erano strettamente fusi sin dall’inizio. 


5.2. Estensioni finite dei corpi p-adici. 


Con la chiusura di Q nella topologia ordinaria otteniamo i numeri reali R. 
Questo corpo non è algebricamente chiuso, ma la sua chiusura algebrica C 
è di grado 2 su esso. Il corpo € dei numeri complessi è contemporaneamente al- 
gebricamente chiuso e topologicamente completo. 

La situazione con il corpo Q, è notevolmente più complessa. Esso pure non 
è, come R, algebricamente chiuso, ma la sua chiusura algebrica Q, ha suQ, 
grado infinito. Di più, Q, non è topologicamente completo e il suo comple- 
tamento Q, è ancora una estensione a infinite dimensioni su d, Il corpo 
Q, =C, è l'analogo p-adico dei numeri complessi; esso è algebricamente chiuso 
e topologicamente completo. Ma esso è molto più lontano da Q, che non C 


3 
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da R. Inoltre in esso vi è una brutta topologia (per esempio, non localmente 
compatto) ed è ancora molto poco studiato. Lo studio del gruppo di Galois del 
corpo Q, su Q, costituisce l’oggetto della teoria locale dei corpi di classi. 
Ogni estensione algebrica finita del campo Q, si può ottenere come completa- 
mento di un'estensione finita K del campo Q rispetto ad una topologia g-adica, 
dove g è l’ideale primo, divisore di p nell'anello dei numeri interi del campo K. 


5.3. Adeli e ideli. 


La topologia reale di Q e le sue topologie p-adiche esauriscono tutte le to- 
pologie che possono essere date mediante norme con la disuguaglianza trian- 
golare. Per molti aspetti è comodo considerare tutte queste topologie su uno 
stesso piano in un arco di questioni possibilmente più esteso. Chiamiamo ognu- 
na delle immersioni Q0+Q,, oppure Q+R del corpo Q in uno dei suoi comple- 
tamenti punto di questo corpo; i punti Q+Q, si dicono finiti, mentre il punto 
Q+R si dice infinito. (Questo linguaggio classico concorda con la terminologia 
della geometria algebrica, nella quale i punti Q-+Q, corrispondono agli ele- 
menti massimali in Spec Z). L’oggetto più grande, che riunisce tutte queste 
immersioni, è l’omomorfismo Q-+]]Q,, dove v si estende a tutti i punti di Q 


v 
sia finiti che infiniti. Gli elementi di TTQ. sono successioni infinite (a, %g, 
%3, ...), dovea e R, «€ Q, (al numero n.6 Q è associata la successione (4, &, ...)) 
e dove ogni coordinata di questo vettore viene considerata quale elemento del 
corrispondente completamento. 
L’anello INCA è molto grande. In esso gli elementi (a, «, ...), x«cQ, soddi- 
v 


sfano una limitazione ulteriore: tutte le loro coordinate, ad eccezione di un nu- 
mero finito, sono numeri interi nel corrispondente completamento (fanno ec- 
cezione i divisori del denominatore di x e, eventualmente, co). L’insieme di 
tutti gli elementi di ]]Q, che soddisfano questa condizione si chiama anello 


v 
degli adeli del corpo Q (questo insieme è chiuso rispetto alla somma e al pro- 
dotto e contiene o e 1). L'insieme di tutti gli elementi invertibili di questo 
anello si chiama gruppo degli ideli del corpo Q. 

Queste definizioni si estendono senza molte variazioni ad ogni estensione 
finita X del corpo Q. I suoi punti finiti sono le immersioni K+XK,, dove g 
sono gli ideali primi dell’anello degli interi di K, mentre K, sono i completa- 
menti corrispondenti. I suoi punti infiniti sono l'immersione di KX in R, o le 
coppie di immersioni complesse coniugate di K in C; R o € sono i comple- 
tamenti corrispondenti. L’anello Ax degli adeli è il sottoanello di [[K, costi- 


tuito dai vettori, le cui coordinate sono quasi ovunque intere; il gruppo degli 
ideli di X è il gruppo degli elementi invertibili di Ag: i suoi elementi hanno 
tutte le coordinate non nulle, e queste sono quasi ovunque unità g-adiche. 

Il linguaggio degli adeli e degli ideli è largamente usato nelle indagini con- 
temporanee nella teoria dei numeri algebrici, nella teoria dei corpi di classi, 
nell’aritmetica delle varietà algebriche. [JU. I. M.]. 
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Fin dai tempi della filosofia naturale dell’antica Grecia s'è posto il problema della 
divisibilità della materia, dello spazio/tempo e s’è rivelata l'opposizione continuo/ 
discreto, alla quale si riconducono in particolare le teorie atomistiche (cfr. atomo e 
molecola e, per le aporie relative alla divisibilità dello spazio ed al moto, dialettica). 
In questo articolo tuttavia si trattano precipuamente gli aspetti teoretico-numerici e al- 
gebrici della divisibilità. 

I principali concetti di essa vengono presentati in rapporto ai numeri naturali; in 
applicazioni si illustrano situazioni più generali ove ha senso l’operazione di divisibilità, 
Ma già l’ambito ristretto dei numeri è sufficiente a presentare concetti e strumenti — 
come il massimo comun divisore o l’algoritmo d’Euclide — di grande forza penetrativa. 
Ed i problemi della teoria dei numeri (cfr. numero) sono tra i più sottili ed intricati 
della matematica. L’approssimazione dei reali mediante razionali è profondamente le- 
gata, oltre che ad esigenze pratiche immediate (cfr. calcolo), ad una vasta gamma di fe- 
nomeni, come la cosmologia teorica (cfr. stabilità/instabilità, cosmologie) o la teoria 
dei suoni musicali (cfr. suono/rumore) e l'armonia. 

Gli aspetti algebrici della divisibilità mettono in rilievo l’importanza delle strutture 
matematiche. Nell'ambito generale della teoria degli anelli è possibile cogliere i legami 
fra la teoria dei numeri e la geometria algebrica (cfr. geometria/topologia, curve e 
superfici), evidenziando il ruolo della dualità, e la distinzione fondamentale razionale/ 
algebrico/trascendente. 


Dualità 


Scopo principale di questo articolo è la descrizione dei differenti impieghi 
della parola ‘dualità’ in quanto termine matematico. La dualità, e i termini ana- 
loghi (coniugazione, reciprocità) figurano nella denominazione sia di costruzioni 
generali (dualità degli spazi lineari, funtori aggiunti) che di teoremi particolari 
(dualità di Poincaré, legge di reciprocità di Artin). In tutte le varie utilizzazioni 
della parola è contenuta l’idea di simmetria bilaterale di un oggetto, una costru- 
zione o una teoria matematica. Tale simmetria può non essere completa: gli og- 
getti legati dalla dualità possono avere natura differente. 

L’idea di dualità ha un carattere estremamente generale. È naturale che essa 
trovi una sua espressione anche in altri campi della ricerca scientifica. Fra le cor- 
relazioni più vicine alla dualità matematica si trovano, ad esempio, il principio 
delle classificazioni dicotomiche, le «opposizioni » dello strutturalismo contem- 
poraneo (linguistica, etnografia), la «complementarità » nella fisica quantistica, 
inclusa l’interpretazione più ampia che ne dà Niels Bohr. Una esposizione pura- 
mente matematica della teoria della dualità, senza alcun legame con tali conce- 
zioni, sarebbe unilaterale. Pertanto l’introduzione sarà dedicata a questi aspetti 
meno formali della dualità. 


Dualità fenomenologiche. Invarie discipline si possono individuare numerose 
contrapposizioni a coppie nel sistema dei concetti fondamentali direttamente con- 
nessi con il materiale osservato. Cosf, dai dati di sistemi mitologici differenti si 
ricostruiscono le opposizioni fondamentali della concezione arcaica del mondo: 
caos/ordine (nei miti cosmologici), terrestre/celeste, sinistro/destro, rosso/nero, 
maschile/femminile. Esse si fondano sull’esperienza diretta, anche se subiscono 
una complessa simbolizzazione nel sistema. A questa stessa classe si possono ri- 
condurre quelle coppie di categorie della scienza contemporanea come fenotipo/ 
genotipo in biologia o particella/antiparticella in fisica. La scoperta di queste 
coppie spesso è accompagnata anche dalla scoperta di una loro disparità di ruoli 
(rottura della simmetria). Nel nostro mondo predomina nettamente la mate- 
ria, e non l’antimateria. Negli organismi viventi viene usata e prodotta solo una 
delle due forme specularmente opposte di sostanze otticamente attive (Pasteur): 
ad esempio nell'uomo la forma destrogira del glucosio, e non quella levogira 
del fruttosio. Le opposizioni, che regolano importanti aspetti della vita sociale e 
della cultura, non sono simmetriche: uno degli elementi della coppia viene con- 
siderato «proprio », «buono », «normativo », in contrapposizione a «estraneo » e 
«cattivo ». Si vedano le tracce dell’antica relazione della destra con il buono, con 
il giusto, e della sinistra con il cattivo, con l’impuro, ecc., nella semantica delle 
parole moderne: in inglese right, sinister, in francese droit, in russo nPaBbilf. 


Dicotomte e contrapposizioni. Ad un livello superiore di astrazione rispetto 
alle coppie considerate in precedenza appartengono le opposizioni «presenza/ 
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assenza di contrassegni ». Il principio della classificazione dicotomica di alcune 
classi di oggetti consiste nel fatto che a) si sceglie una certa famiglia di con- 
trassegni, e d) ogni oggetto viene caratterizzato in relazione a tale famiglia da una 
successione, ad esempio, di zeri (assenza del dato contrassegno) ed uni (sua 
presenza). Cosi Jakobson, Fant, Halle hanno proposto una classificazione dicoto- 
mica di tutti i possibili suoni del discorso nelle diverse lingue del mondo, fondata 
su dodici coppie di contrassegni differenziali, tra i quali vocalico/non-vocalico, 
consonantico/non-consonantico, nasale/orale, ecc. Secondo questi contrassegni 
r è vocalico/consonantico/orale (110), e è (i-breve) è non-vocalico/non-conso- 
nantico/orale (000). La classificazione in generale è uno dei più semplici e più im- 
portanti strumenti dell’indagine scientifica. La classificazione dicotomica dal 
punto di vista della matematica conduce ad una scoperta importante: la crescita 
logaritmica, cioè molto lenta, della quantità d’informazione in dipendenza dalla 
molteplicità degli oggetti studiati. Sei risposte si/no permettono di descrivere 
univocamente un qualsiasi oggetto (suono del discorso) scelto fra 64, il che ba- 
sta per la maggior parte delle lingue del mondo; dodici segni, in linea di prin- 
cipio, possono bastare per la descrizione di 21° = 4096 suoni. Una risposta si/no 
porta una unità d'informazione. L'organizzazione del materiale secondo l’antico 
principio della dicotomia conduce a numerare ogni oggetto con un numero bi- 
nario, come nella notazione posizionale molto diffusa nei calcolatori contempo- 
ranei. Una buona classificazione dicotomica, evidentemente, si differenzia da 
un’arbitraria numerazione binaria per il fatto che le posizioni degli zerifuni non 
sono arbitrarie, ma corrispondono a contrassegni rilevanti degli oggetti. Ogni po- 
sizione definisce una famiglia di oggetti contrapposti a due a due, che differi- 
scono solo per il contrassegno ad essa corrispondente. 

Tutte queste caratteristiche della dicotomia, che spiegano la sua fondamen- 
tale importanza, raramente s'incontrano allo stato puro. La discretizzazione 
della scala continua di gradazioni di un contrassegno in due valori può risultare 
troppo rozza per altri scopi. Non tutte le 2* combinazioni di x contrassegni pos- 
sono risultare possibili o equiprobabili: cosî la vocalicità del suono si combina 
soprattutto con la sua non-consonanticità, e viceversa, in accordo con la gram- 
matica elementare. Queste correlazioni o regole di interdizione definiscono una 
certa struttura nell’insieme dei contrassegni, che spesso è più importante della 
struttura dell’insieme degli oggetti: le leggi scientifiche si possono formulare in 
termini di proprietà, ma non di cose. 


+ Complementarità. Al livello successivo l’idea di dualità si traduce nell’indi- 
viduazione di alcune coppie di categorie di carattere metodologico. In termini di 
queste categorie si può descrivere il metodo di un’indagine concreta, il proce- 
dimento di elaborazione del materiale e di rappresentazione dei risultati. Inol- 
tre in ogni indagine concreta domina in genere soltanto uno dei membri della 
coppia. 

Categorie di questo genere sono: analisi/sintesi, soggetto/oggetto, causa/fine 
(in biologia: un organo esiste perché..., oppure affinché...), immagine/sfondo, 
sincronia/diacronia (in linguistica), continuo/discreto, ecc. Molte di queste cop- 
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pie manifestano gli aspetti caratteristici della complementarità. Essa si manife- 
sta nel fatto che la descrizione in termini di uno qualsiasi dei membri della cop- 
pia è incompleta, mentre le descrizioni simultanee in termini di entrambi i mem- 
bri risultano incompatibili. Nello stesso tempo nessun elemento della coppia è 
semplicemente la negazione dell’altro nel senso classico della parola. 

Il termine stesso ‘complementarità’ è stato introdotto da Niels Bohr all’epo- 
ca della fondazione della meccanica quantistica per caratterizzare opposizioni 
quali onda/particella. Non è questo il luogo per entrare nei particolari del signi- 
ficato classico di tali termini. È sufficiente dire che la luce, descrivibile classi- 
camente con equazioni d’onda, manifesta la sua natura corpuscolare ad esempio 
nell’effetto fotoelettrico, dove ogni atto di assorbimento di luce di frequenza y 
da parte di un atomo è accompagnato dal trasferimento di un’energia 4y (0, con 
piccola probabilità, di un multiplo intero di 4y, ma mai di, ad esempio, 4v/2). 
Queste porzioni sono i fotoni. Viceversa, come è stato scoperto in seguito, una 
particella come l’elettrone, che senza dubbio dal punto di vista classico è una par- 
ticella e non un’onda, nella diffusione in un reticolo cristallino manifesta la sua 
natura ondulatoria. Questo dualismo si concretizza oggi in apparecchi scientifici 
di uso corrente: l’astronomo che, con esposizione di molte ore, raccoglie i fotoni 
su una lastra fotografica, sfrutta i «corpuscoli di luce », mentre il biologo che la- 
vora col microscopio elettronico riesce ad ottenere un ingrandimento impossibile 
nella banda ottica grazie alla piccolezza della lunghezza d’onda associata all’elet- 
trone. 

Per Bohr la complementarità degli aspetti ondulatorio/corpuscolare consi- 
steva, in particolare, nell’impossibilità che entrambi questi aspetti si manifestas- 
sero simultaneamente in un unico esperimento. Solo l’interazione della radiazione 
o del fascio di elettroni con un sistema macroscopico di tipo speciale (lo stru- 
mento) conduce al fenomeno osservato, che noi classifichiamo nei casi estremi 
come ondulatorio o corpuscolare. Nei casi intermedi entrambi i modi di descri- 
zione classici risultano solo limitatamente applicabili. Inoltre alcune coppie di 
grandezze classiche (come posizionefimpulso di una particella) vengono a trovar- 
si, in meccanica quantistica, in rapporto di complementarità, cessando di essere 
contemporaneamente misurabili con un arbitrario grado di precisione. Nel $ 3 del- 
l'articolo si descriveranno i modelli matematici di tali coppie di variabili coniu- 
gate, e si darà la formulazione precisa del « principio d’indeterminazione » di Hei- 
senberg, che stima il prodursi di una dispersione attorno al valor medio di due 
osservabili che non commutano. A questo principio si è attribuita un’importanza 
particolare nei primi anni della fondazione della meccanica quantistica. Oggi noi 
comprendiamo che esso è solo una semplice conseguenza dei suoi postulati fon- 
damentali, dalla quale questi stessi postulati non possono in alcun modo essere 
dedotti. 

Senza riferirsi a modelli teorici particolari, Bohr mise in luce un aspetto qua- 
litativo della complementarità quantistica: l’influenza inevitabile e non prevedi- 
bile dell’osservazione sul sistema osservato. In tale formulazione la complemen- 
tarità ha un’implicazione filosofica, presentando sotto una nuova luce il dualismo 
soggetto/oggetto che pervade tutta la scienza. In tutti i procedimenti delle scienze 
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naturali il soggetto osservante analizza alcune caratteristiche del sistema osser- 
vato, che egli si rappresenta come completamente isolato attraverso l'esclusione 
delle azioni estranee. In effetti all’atto stesso della misura il sistema cessa di es- 
sere isolato, diventando parte di un unico complesso osservatore + osservato. 
Perciò si analizzano in realtà alcuni parametri di questo sistema complessivo. È 
necessario ancora sottolineare che in meccanica quantistica l'unificazione di que- 
sti sistemi comporta dei legami forti e non classici tra le parti. 


Dualità, matematica e linguaggio. Anche iprimi esempi di dualità matematica 
hanno avuto origine da «materiale osservabile »: numeri e figure. Se ne porteran- 
no qui due esempi: la costruzione del piano proiettivo e la legge di reciprocità 
quadratica. 


Piano proiettivo. Sul consueto piano euclideo per due qualsiasi pun- 
ti passa esattamente una retta, ma non è detto che due rette arbitrarie si inter- 
sechino esattamente in un punto: le coppie di rette parallele sono un’eccezione. 
Poncelet e Gergonne (intorno al 1820) dimostrarono che di questa asimmetria 
ci si può liberare, estendendo il piano euclideo a quello proiettivo. Il piano proiet- 
tivo si ottiene da quello euclideo aggiungendovi una «retta all’infinito », i cui 
punti siano in corrispondenza biunivoca con i fasci di rette parallele del piano 
euclideo. Ogni retta L interseca la retta all’infinito nel punto che corrisponde 
al fascio delle rette parallele ad L. l 

L’intero insieme dei punti e delle rette del piano proiettivo soddisfa alle se- 
guenti condizioni: i 


1) Per due punti arbitrari distinti passa esattamente una retta. 
2) Due rette arbitrarie distinte si intersecano, esattamente in un punto. 


Una serie di altri assiomi della geometria piana assume un aspetto simme- 
trico rispetto allo scambio retta/punto con la conservazione della relazione «la 
retta ed il punto sono incidenti » (che è l'equivalente simmetrico delle relazioni 
«il punto giace sulla retta » e «la retta passa per il punto »). Perciò tale sostitu- 
zione permette di raddoppiare automaticamente il numero di teoremi sul piano 
proiettivo. La peculiarità di questo esempio consiste nell’introduzione del nuovo 
concetto di punti «ideali » o «all'infinito » del piano euclideo, le proprietà dei quali 
sono dettate proprio dalla condizione che la simmetria incompleta di un oggetto 
iniziale acquisti completezza. 

La dualità proiettiva è stata una delle fonti della più generale e profonda teo- 
ria della dualità degli spazi lineari, per i cui aspetti algebrici cfr. $ 2.1. 


Legge di reciprocità quadratica. Siano n ed m due numeri interi. 
Un numero mm si chiama residuo quadratico modulo n se esiste un intero x tale 
che m ed x? divisi per n dànno lo stesso resto. Nel caso contrario m viene detto 
non-residuo quadratico. Ad esempio 3 è un non-residuo quadratico modulo 5 
e 7, ma è un residuo quadratico modulo 11 (5° diviso 11 dà resto 3). 


Si definisce il simbolo di Legendre (5) , per due numeri interi m ed x primi 
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tra loro, mediante la condizione (5) = se m è residuo quadratico modulo x; 


m x . 
(2) =—I In caso contrario. 
n 


La parte più importante e di più semplice formulazione del teorema detto 
legge di reciprocità quadratica afferma che se f e g sono due differenti numeri 


RIBES () ( ep _(3\(7 
rimi dispari, allora {-—|J|-]|=(—1 . » {=]J{-}=(— . — 
e) ennio ()()--0-0 


Che questa simmetria sia inattesa dipende dal fatto che nella definizione del 
simbolo (6) i numeri e g entrano in modo molto asimmetrico : q come divisore 


e p come dividendo. 

Come fatto sperimentale la legge di reciprocità avrebbe potuto essere osser- 
vata fin dai tempi dell’antichità (fornendo un bellissimo esempio di magia pita- 
gorica dei numeri). In realtà fu scoperta da Eulero, e la prima (incompleta) di- 
mostrazione fu data da Legendre. Gauss propose otto differenti dimostrazioni 
della legge di reciprocità quadratica. Esse si basano su principî diversi e mettono 
in luce aspetti diversi di questa notevole simmetria. Dal punto di vista contem- 
poraneo essa è risultata inclusa nella profonda teoria dei corpi di classi, in cui 
hanno importanza alcune dualità generali — la dualità di Galois (estensioni di 
campi/gruppi); la dualità dei gruppi abeliani (gruppi/caratteri); la dualità di 
Fourier — e le loro concrete realizzazioni aritmetiche. 


Proprio queste significative osservazioni matematiche furono storicamente 
il fondamento dell’individuazione del concetto generale di dualità. Nel $ 1 sa- 
ranno esposti alcuni esempi fondamentali che illustrano la struttura algebrica e 
le applicazioni della dualità. Il $ 2 è dedicato al ruolo del linguaggio categoriale, 
che permette di formalizzare ed unificare sotto dualità concrete una serie di os- 
servazioni in precedenza eterogenee. Infine il $ 3 è dedicato alla relazione fra 
dualità e continuità. 

Va sottolineato che, nonostante il continuo ampliarsi dello spettro delle co- 
struzioni matematiche concrete, in matematica resta utile la stessa idea indefinita 
di dualità, potenzialmente aperta e non ridotta a nessuno dei contesti in cui la 
parola ‘dualità’ sia usata come termine tecnico. 

A maggior ragione ciò riguarda la semantica delle dualità matematiche, quan- 
do esse appaiono nell’apparato delle scienze applicate. 

Per esempio si può notare che nella maggior parte delle dualità matematiche 
si considerano versioni concrete della opposizione generale locale/globale nei 
suoi diversi aspetti. Esempio tipico: un vettore nello spazio (locale) / un funzio- 
nale sullo spazio (globale). Oltre a ciò, le più importanti costruzioni della dualità 
ammettono come sovrastruttura alcuni nuovi oggetti che sintetizzano i membri 
della coppia in un’unica struttura spesso simmetrica rispetto a questi membri. 
Allora il confronto dei singoli membri della coppia con il locale o con il globale 
perde il suo significato assoluto: ciascuno di essi può essere locale da un certo pun- 
to di vista e globale da un altro punto di vista. Proprio questo è il meccanismo 
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di superamento della contraddizione onda/particella in meccanica quantistica. 

Questo esempio è caratteristico: esso mostra come la matematica svolga un 
ruolo di effettiva mediazione nella descrizione della sintesi dei membri com- 
plementari di una opposizione. La semantica della matematica, come linguag- 
gio, è libera; uno «spazio lineare» dal punto di vista di una interpretazione 
«realistica » è un recipiente vuoto, pronto per essere riempito di significati di- 
versi. Uno spazio lineare e lo spazio lineare ad esso coniugato formano una cop- 
pia universale di concetti, la simmetria della cui descrizione matematica libera il 
cervello dalle restrizioni accumulate dalla semantica del linguaggio comune. Le 
possibilità di quest’ultimo, in tale campo, sono estremamente limitate e non of- 
frono una valida alternativa (cfr. anche i modelli matematici e filosofici delle 
opposizioni causa/fine, casuale/deterministico). 

D'altra parte il linguaggio naturale possiede senza dubbio alcune qualità 
complementari (le quali hanno permesso, ad esempio, di descrivere proprio 
il concetto di complementarità senza essere legati a sue realizzazioni troppo 
rigide). 

Il pensiero mitologico, poetico, umanistico (ed a livelli diversi anche delle 
scienze naturali) trova un altro sbocco risolvendo i suoi problemi di sintesi me- 
diante la complementarità: esso edifica costruzioni linguistiche lontane dalla pre- 
cisione, ambigue, irritanti, ma che stimolano l'immaginazione, La correlazione, 
già rilevata da Schleicher in molti linguaggi indoeuropei, dell’idea di ‘due’ con 
l’idea di ‘dubbio’, ‘timore’ (o ‘duplicazione’) (si veda il tedesco Zwei/Zweifeln, 
il greco dotéc/Sow, il latino duo/dubius) è riscontrabile a tutti i livelli dell’atti- 
vità linguistica sociale, fino alla comparsa della « doppiezza » come tema della let- 
teratura mondiale (dai «romanzi del terrore » fino a Dostoevskij). La naturale 
reazione positivistica all’abbondanza di testi ambigui nella letteratura al confine 
fra scienza e filosofia della natura era inevitabile. L'espressione più concisa di 
tale reazione è nella famosa tesi di Wittgenstein «ciò che in generale può essere 
detto può essere detto chiaramente, e di ciò di cui non si è in grado di parlare 
occorre tacere ». Secondo l’ironica classificazione di Bohr questo detto esprime 
senza dubbio una profonda verità: esso è vero assieme alla sua negazione, che è 
anch’essa una profonda verità. Tuttavia val la pena di pensare agli enormi filoni 
della cultura e dell’attività umana sui quali incombe il divieto dell’imperativo di . 
Wittgenstein inteso letteralmente. Il medico è disposto ad apprezzare grande- 
mente la chiarezza di giudizio del fisiologo, ma egli stesso è costretto ad elabo- 
rare troppi fatti in troppo poco tempo ed a parlare, non riuscendo ad essere chiaro. 


1. Esempi fondamentali: discreti e a dimensione finita. 


1.1. Dualità booleana. 


Formalismo. Si consideri un insieme B, nel quale siano dati due elementi 
specificati 0,1 B, due leggi di composizione binarie A (intersezione o molti- 
plicazione) e V_ (unione o somma), e un'operazione ‘ (complemento). La strut- 
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tura B={B; 0,1; A\,V;/} si chiama algebra booleana se sono soddisfatti i se- 
guenti assiomi: 


1) Per tutti gli e B si ha (a')=a, '=1, 1'=o. 
2) Le operazioni A, V sono associative e commutative, cioè per ogni a, b, ce B 


aNnb=bNa (aNb)Nc=aN(b Ac) 
aVb=bVa aV(bVe)=(avb)ve. 


3) Le operazioni A, V sono distributive l’una rispetto all’altra, cioè per ogni 
a,b, ce B 


av(bAc)=(avb)n(aVe) —an(bVve)=(aAb)V(anc). 
4) Le operazioni A, V sono duali rispetto a /, cioè per ogni a, be B 
(av b)'=a'Ab' (aNb)'=a' VD. 
5) Per ogni ae B si ha aVa=aNa=a, 1Na=a e oVa=a. 


Esempio. L'insieme {o, 1} costituisce la più semplice algebra booleana 
B, di due elementi con le operazioni aVb=max(a, dB), a \b=min(a, b), 
a'=1-a. In generale l'insieme B,, dei «codici binari » di lunghezza n, cioè delle 
successioni di n zeri/uni, forma un’algebra booleana di 2* elementi. Per addizio- 
nare o moltiplicare due siffatte successioni occorre compiere la corrispondente 
operazione sui simboli binari di ciascun posto, e scrivere il risultato nello stesso 
posto. Per esempio, (o110)V (1100)=(1110), (010) \(101)= (000). 

Gli schemi elettronici che realizzano tali operazioni booleane erano tra le 
fondamentali unità di struttura dei calcolatori delle prime generazioni. 


Nell’introduzione si è già parlato dei legami fra la numerazione binaria e la 
classificazione dicotomica. Se si interpreta il segno 1/0 nella i-esima posizione 
come indicazione di presenza/assenza dell’i-esimo contrassegno, allora ogni ele- 
mento dell’algebra booleana B,, descrive un certo insieme di oggetti classifica- 
bili: per esempio (orro) corrisponde agli oggetti che posseggono il secondo e il 
terzo contrassegno, ma non il primo e il quarto. 


Esempio. Se Sè un insieme qualsiasi, allora l’insieme di tutte le sue parti 
B=9(S) forma un’algebra booleana con dati strutturali {o=@,1=$; 0, U; 
complemento insiemistico in $}. 

Esempio. Se Sè uno spazio topologico, allora il sistema dei suoi insiemi 
aperti regolari, cioè gli insiemi aperti con la condizione a'/= a, dove l'elemento a’ 
è definito come l'insieme dei punti interni al complemento di «a, è un’algebra boo- 
leana. Le operazioni V, A coincidono con U, N rispettivamente. 


Nel seguito è descritto il legame di questi esempi rispettivamente con la logica 
classica e con quella intuizionista. 

A fondamento della dualità booleana sta la seguente osservazione: se negli 
enunciati degli assiomi 1-5 si scambiano di posto dovunque o con 1, e VV con A, 
si ottiene un sistema di assiomi equivalente. 
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Questa osservazione conduce ad alcune conseguenze. La prima di queste è il 
principio di dualità nella metateoria delle algebre booleane, che permette senza 
sforzo di «raddoppiare » il numero delle identità booleane dimostrabili. Invero, 
sia data una qualsiasi identità booleana di validità generale, cioè che rimane vera 
comunque si sostituiscano le lettere che compaiono in essa con elementi arbitrari 
di una qualsiasi algebra booleana. Allora, invertendo in essa o e I, e A e V, si 
ottiene ancora un'identità di validità generale. 

Questo principio, che è un corollario della simmetria della teoria, è visibile 
già a livello di assiomi. Non ci sono molti esempi del genere; si può ancora ci- 
tare la dualità proiettiva e la dualità delle iper-algebre (cfr. $ 1.4). 

Un'altra conseguenza è la possibilità di costruire per ogni algebra booleana 
B={B;0,1; A, V;‘} Falgebra booleana ad essa duale B*={B*; 0*, 1*; A*, 
v*;/*}, dove B*=B,0*=1, \*=V, v*=A/,'*=/'. La simmetria degli as- 
siomi mostra che B* è un’algebra booleana; evidentemente (B*)*=B. 

L’esistenza di un oggetto duale è un aspetto caratteristico di una serie di teo- 
rie. Tuttavia è raro che esso sia canonicamente isomorfo all’oggetto iniziale. Nella 
teoria delle algebre booleane accade proprio cosî, nel che si manifestano le pro- 
prietà di simmetria dell’operazione ‘. 

Invero, l’applicazione B+B*:a4+a' è un isomorfismo dell’algebra B con 
l’algebra duale B*. 

Se s’interpreta ’ come un’operazione di complemento (per esempio nelle al- 
gebre P(.5)), allora diventa chiaro fondamento significativo del principio di dua- 
lità: il complemento insiemistico scambia di posto o= @ con r= Se U con N. 

La teoria delle algebre booleane, date dagli assiomi 1-5 come oggetti di teo- 
ria degli insiemi, ha un ulteriore aspetto logico. Essa si rivela, passando al lin- 
guaggio duale, un «calcolo degli enunciati » (alla nuova e non formale dualità 
linguaggio/modello che appare qui si tornerà nel $ 2). 


Algebre booleane e logica. 


Linguaggio degli enunciati. 


In logica formale i segni A, V, ’ sono usati per denotare connettivi logici: 


le operazioni «e», «o» (non esclusivo: vel), «non», usate per congiungere al- 
cuni enunciati in uno nuovo. Il linguaggio formale degli enunciati consiste di 
espressioni in un alfabeto finito, ottenute da espressioni di una sola lettera o 
(falso), 1 (vero), f1, -.., f, (enunciati atomici) mediante applicazioni successi- 
ve di queste operazioni; ad esempio ((f, fs) V pz)". Alcune espressioni risultano 
equivalenti dal punto di vista logico, per esempio p, A ps € Pa AP. Proprio nella 
descrizione di una tale equivalenza consiste la descrizione della logica del lin- 
guaggio. Si considereranno brevemente due logiche: quella classica e quella in- 
tuizionista. La logica classica modella il meccanismo delle inferenze deduttive, 
utilizzate dalla matematica consueta. La logica intuizionista modella una rela- 
zione pit ristretta di equivalenza logica, elaborata come risultato dell’analisi de- 
gli aspetti positivi della critica intuizionista ai fondamenti della matematica, ini- 
ziata da Kronecker e da Brouwer. Dal punto di vista dell’argomento di questo 
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articolo, la differenza fondamentale tra la logica intuizionista e quella classica 
consiste nel rifiuto della simmetria della negazione: l’enunciato p'’ è logicamente 


equivalente a p da un punto di vista classico, ma non dal punto di vista intuizio- 


nista. In altre parole, nella logica intuizionista non è vera la legge del terzo 
escluso. 


Equivalenza logica nella logica classica. Siano Pe Q due enun- 
ciati formati da enunciati atomici fi, ..., 9. Si consideri un’algebra booleana del 
tipo P(S) e si attribuiscano a fi, ..., Py degli arbitrari valori di P(S). Interpre- 
tando poi A, V e’ come le operazioni N, U e complemento in 9($), si pos- 
sono assegnare a P e Q dei valori in P (5). Gli enunciati P e Q sono equiva- 
lenti dal punto di vista della logica classica se per qualunque S e per qualsiasi 
valore di f,, ..-, p, in .S i valori di P e O sono gli stessi. 

Equivalenza logica nella logica intuizionista. Siano P e Q due 
enunciati formati da enunciati atomici |;, ..., j, come sopra. Sia .S uno spazio 
topologico. Si consideri l'insieme 9(,5) degli aperti di $, e si assegnino a fi, ..., 
b, dei valori qualsiasi da 9(.S). Interpretando poi A, V e’ come le operazioni 
N, U e «l'insieme dei punti interni del complemento » in 9(.S), si possono as- 
sociare a Pe Q dei valori in 9(S). Gli enunciati P e Q sono equivalenti secondo 
la logica intuizionista se per ogni spazio topologico S e per valori arbitrari di 
Py +» da in I(S) i valori associati a P e O sono gli stessi. 

Da questa descrizione si può evincere il seguente risultato di Gòdel: nell’am- 
bito degli enunciati consistenti in doppie negazioni la logica intuizionista coin- 
cide con ‘quella classica. 


Dualità logica. 


Se P è un enunciato (nel linguaggio degli enunciati), allora l’enunciato ad 
esso duale P* si ottiene per sostituzione di A con V, di o con 1, di tutti gli 
enunciati atomici che entrano in P mediante le loro negazioni, e negando il 
risultato. (Nel linguaggio dei predicati, che ha come strumenti di espressione 
anche i quantificatori universale V ed esistenziale %, occorre anche sostituire 
V con 1, e viceversa). Nella logica classica P e P* sono logicamente equivalenti, 
nella logica intuizionista ciò non è vero. 


Asimmetria della negazione. 


La critica intuizionista mette in luce caratteristiche di asimmetria della ne- 
gazione, o passaggio al complemento, significative, in una opportuna interpre- 
tazione, anche nella matematica classica. 

Un esempio tipico di questa asimmetria si manifesta nella teoria dei sottoin- 
siemi computabili dell'insieme dei numeri naturali N. Diremo che un sotto- 
insieme ECN è computabile se esiste un algoritmo che assegna gli elementi di 
E in un certo ordine. Si può dimostrare che esiste un insieme computabile E 
tale che il suo complemento non è computabile. In questo modo l’operazione di 
complemento porta fuori dai limiti dell'universo degli insiemi computabili, che 
da molti punti di vista è l’ambiente naturale per la matematica algoritmica. 

Un modello analogo di asimmetria del passaggio al complemento si ottiene, 
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nell’ambito della teoria classica degli insiemi, se si considera come universo la 
classe V di «tutti» gli insiemi di Neumann-Zermelo-Fraenkel. Il complemento 
di un insieme di questa classe è una classe, e non un insieme, cosicché V*%V. 

L’essenza di questa critica consiste nel fatto che anche nei nostri modelli di 
pensiero l’universo idealizzato nel quale lavoriamo è spesso incomparabilmente 
più grande del dominio degli oggetti sottoposti realmente ad investigazione, e il 
complementare di questa regione risulta quasi ipso facto inaccessibile. 

Il trascurare questa critica nel nome dei vantaggi di una dualità ideale sembra 
essere una delle importanti sorgenti della forza della matematica classica. 


1.2. Dualità degli spazi lineari. 


Questo paragrafo è dedicato ad una delle costruzioni più importanti. Sia per 
il numero delle applicazioni e dei casi particolari che per la struttura generale, la 
dualità degli spazi lineari può essere considerata il prototipo delle dualità matema- 
tiche. Nel $ 3 vi si ritornerà, considerando nella discussione anche gli aspetti 
topologici. 


Linearità e spazi lineari. Sia k un campo (per esempio il campo reale R o 
il campo complesso C). Si ricordi che uno spazio lineare (o vettoriale) L su & è 
un insieme di elementi (vettori) che possono essere addizionati tra loro e mol- 
tiplicati per elementi di &. Queste operazioni sono regolate da semplici assiomi. 


Esempio. Sia X un insieme. Le funzioni su X a valori in & formano uno 
spazio vettoriale su &. Se X= {1, ..., n}, una qualsiasi funzione di questo tipo 
può essere rappresentata come una famiglia indicizzata di numeri, o vettore n- 
dimensionale (41, ..., an), a;ek. Lo spazio vettoriale corrispondente si indica 
con £”, ed è chiamato spazio coordinato x-dimensionale (su £). Lo spazio linea- 
re L si dice a dimensione finita se esiste un isomorfismo di L con k", per un x 
opportuno, e a dimensione infinita in caso contrario. Questo numero x, se esiste, 
è definito univocamente e si dice dimensione di L. La scelta di un isomorfismo 
di ZL con A" equivale all’introduzione di un sistema di coordinate in L. Si può 
sostituire questa scelta con la scelta di una base in L, cioè di una famiglia di vet- 
tori (2, ..., L), e L tale che ogni vettore di L sia esprimibile univocamente 

n 
nella forma Y ajl;, a;€k. 
1 

Probabilmente nelle scienze naturali l'aspetto più importante dell'idea di li- 
nearità è il principio della linearità dei piccoli incrementi. Nella sua forma più 
semplice esso postula che una funzione di argomento reale f(x) goda della pro- 
prietà: f(x0+e)—fo(x)=cost-e+ (infinitesimi di ordine superiore rispetto ad 
e), per e+o. Questo è il fondamento del calcolo differenziale e variazionale. 

Il principio di sovrapposizione in meccanica quantistica, che introduce una 
struttura vettoriale complessa sullo spazio delle funzioni d’onda di ogni sistema 
fisico, ha elevato ancora di più lo status ontologico della linearità. Nel suo lin- 
guaggio, in particolare, si dà una descrizione precisa del dualismo onda/corpusco- 


Dualità 136 


lo (cfr. anche $ 3). Infine, nei modelli fondamentali della fisica (meccanica ga- 
lileiana, teoria della relatività ristretta), lo spazio-tempo è lineare su R, e nei mo- 
delli della relatività generale esso è «localmente in piccolo » lineare su R, cioè è 
una varietà differenziabile. Il principio di linearità dei piccoli incrementi è de- 
scrivibile nel linguaggio della geometria differenziale. 


Esempio: spazio tangente in un punto. Sia X una varietà diffe- 
renziabile. Lo spazio 7,,X tangente ad essa nel punto xe X è quello spazio 
vettoriale sui numeri reali che può essere definito nel modo seguente. Sia 
f:(0, 1)-+X un'applicazione liscia, cioè una «curva», passante per il punto x. 
Per ogni funzione liscia F su X si può definire la derivata di Fin x lungo f come il 
dti sm EAU A) -Fof(t) 

lim 
AO At 
se f(t)=x. Si chiama vettore tangente &e 7, X la classe di tutte le curve f 
aventi gli stessi valori delle derivate per tutte le F. Intuitivamente un vettore 
tangente definisce ed è definito dalla classe di curve lisce passanti per il punto x 
con la stessa direzione e con la stessa velocità istantanea. 
‘. Il vettore tangente & e 7, X definisce una derivazione dell’anello delle funzioni 
lisce su X a valori in R:É(aF+bG)= at F+bEG, &(FG)= G(x)&F+F(x)EG, 
dove a,beR e EF è la derivata di F lungo &. 


Si ricordi che, se L e M sono due spazi vettoriali su k, l'applicazione f:L+M 
è detta (k)-lineare se f(al, +51) =af(h)+bf(4) per ogni a,bek; li, heL. 

Esempio. Se X, Y sono varietà differenziabili, f: X-+ Y un’applicazio- 
ne liscia, xe X, y=f(x), allora è definita un’applicazione lineare (df),:7,X> 
-»T,Y degli spazi tangenti. È questo il modello standard del principio di 
«linearità dei piccoli incrementi»; (df), è detto differenziale dell’applicazione 
f nel punto xe X. 


Spazio duale. Sia L uno spazio vettoriale su &. Si dice funzionale lineare 
su L un’applicazione lineare f:L+A. L’insieme di tutti i funzionali lineari 
£(L, k) su L si indica con L* e si chiama spazio duale o coniugato di L. 


Esempio. Lospazio (7, X)*= 7,*X, duale dello spazio tangente nel pun- 
to x, si chiama cotangente. Ogni funzione liscia f su X definisce un elemento 
dello spazio cotangente (df),e 7,*X, per il quale (df),(&)=&f se ge T,X. (Si 
ricordi che € f è la derivata di f nella direzione &). 

Esempio. Sia C[o, 1]lo spazio vettoriale delle funzioni continue su [0, I]. 
L’integrale di Riemann f+ [tf(x)dx è un funzionale lineare su C[o, 1], e perciò 
un elemento di C[o, 1]*. Fissato ge C[o, 1], si può considerare anche il fun- 
zionale fr f1f(x)g(x)dx. Diverse varianti di questa costruzione conducono, 
ad esempio, alla teoria della misura nel linguaggio della dualità degli spazi fun- 
zionali (g(x)dx può essere sostituita da una misura più generale du(x)), ed an- 
che alla teoria delle funzioni generalizzate (distribuzioni) (cfr. $ 3). 
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Principî di dualità. Fissato un vettore /e L, si consideri l’applicazione 
L*-k che all'elemento fe L* fa corrispondere f(/)ek. L'applicazione risultan- 
te è lineare in f e perciò è un elemento dello spazio due volte coniugato 
L**=(L*)*. A sua volta quest'elemento dipende linearmente da f; ciò defi- 
nisce l’applicazione lineare canonica B:L+L**: > {fHf(D)}. 

Il primo principio di dualità lineare è il seguente: L'applicazione canonica 
B:L+L** è un'applicazione lineare iniettiva. Essa è un isomorfismo di spazi 
vettoriali se L è a dimensione finita. 

La linearità di } è evidente dalla definizione. L’iniettività sta ad indicare che 
per ogni /e L esiste fe L* con f(/)£0. Ciò si verifica facilmente per induzione 
transfinita, prolungando f su sottospazi crescenti di L contenenti /. Che f} sia un 
isomorfismo nel caso a dimensione finita si verifica facilmente servendosi di una 
base in L, cioè di un sistema di elementi {l,, ..., ,,}e L tale che ogni Ze L si espri- 


n 
me univocamente nella forma ) a,l;, a;e &. Allora i funzionali /;* e L*, per i quali 
1;#(L)=o per i#j e 1 per is formano una base di L* e, inoltre, B(4,)=(4*)*, 
dove (/;*)* è la base di L** costruita in modo analogo. 

Nel caso a dimensione infinita il «biduale » L** costituisce una estensione 
non banale di L (cfr. $ 3). Un uso analogo della doppia « dualizzazione » per la 
costruzione di oggetti generalizzati s'incontra spesso nella sua variante catego- 
riale (prefasci su categorie: cfr. $ 2). 

Siano L, M due spazi vettoriali, p:L+M un'applicazione lineare. A partire 
da questa si definisce l’applicazione aggiunta g*:M*-L*, che al funzionale 
f:M4+kR fa corrispondere l’applicazione composta fopg:L+A. Si vede facil- 
mente che @* è lineare se lo è ©, e che (pog)*=p*o0*. Applicando ancora 
una volta questa operazione si ottiene l’applicazione lineare p#*: L**> M**. 

Il secondo principio di dualità lineare è il seguente: Nell’identificazione ca- 
nonica di L** con L e di M** con M (L ed M a dimensione finita), l’applica- 
zione p** si identifica con g. 

Se negli spazi L, M si fissano le basi (/;), (72;), allora le applicazioni sono in 
corrispondenza biunivoca con le matrici di dimensione (dim L, dim M) su &: 
alla matrice (4;;) corrisponde l’applicazione 7;+) 4;;m;. Allora nelle basi (m$), 


(1$) all'applicazione * corrisponde la matrice ICDÌ dove di;=a;; («riflessio- 
ne rispetto alla diagonale principale »), e l'applicazione p** corrisponde alla 


duplice riflessione di questa matrice, il che rende ovvia l'uguaglianza 9**= g. 


Siano L>MSN applicazioni lineari tra spazi vettoriali. Si dice che esse for- 
mano un complesso se po è l'applicazione nulla, cioè se Im (immagine di 
g)cKery (nucleo di y). Si dice che questo complesso è esatto in M se 
Img=Kerù. Una terminologia analoga si usa per le coppie di applicazioni 
consecutive in successioni di lunghezza arbitraria ...>L;_1>Lj> Li... Per 


È 4 î Co) È % x DI di 
esempio, il fatto che la successione o-+L + MM sia esatta significa che g è una inie- 


zione di L in M, e che lo sia la successione M +N+o indica che y è una surie- 
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zione di M su N. (Qui o è lo spazio vettoriale consistente del solo vettore 


è « . . (°) CIN . è 
nullo). Ogni applicazione lineare L+>M è inclusa in una successione esatta 


o-+Kerg+L %M-Coker g-o, dove, per definizione, Cokerpg=M/Img è lo 
spazio quoziente di / rispetto all'immagine di g. 

L’ultimo, importante principio di dualità lineare che si ritiene di dover indi- 
care in questa sede può essere formulato nel modo seguente: Se la successione 


® d î . ; Di * < : 
L3M3N è esatta in M, allora la successione N*> M*5 L* è esatta in M*. 
Nel $ 2 si darà una sintetica formulazione categoriale che unifica tutti questi 
principî. 


Sintesi di L e L*. A differenza di quanto avviene nella dualità booleana, 
non esiste un isomorfismo canonico fra gli spazi vettoriali L e L*. La «sintesi » 
di L e dello spazio ad esso duale L* deve effettuarsi mediante un’ulteriore 
struttura esterna. 

‘Tra le più importanti di tali strutture figurano l’assegnazione di un prodotto 
scalare in L e la scelta di una particolare base in L. 


Esempio: scelta di una base. Sia L unospazio a dimensione finita, 
e sia fissata in esso una base (/;, ..., /,). Allora in L* è determinata una base (/#), 
dove Vie d;;, cosa che permette di definire un isomorfismo LS L*: ll}, 
t=1,..., n. Un caso tipico in cui si ha una base assegnata è lo spazio delle fun- 
zioni su un insieme finito, per esempio l’anello di gruppo di un gruppo finito 
(cfr. oltre). 

Esempio: prodotto scalare. Sia E uno spazio euclideo a dimensione 
finita. Ciò significa che, comunque dati due vettori x,ye E, è definito il loro 
prodotto scalare (x,y)cR, lineare in x e y; (x,x) è il quadrato della lunghezza 
del vettore x. L'applicazione E+£*, che al vettore x fa corrispondere il funzio- 
nale y+ (x,y) è un isomorfismo canonico di E con E*. La struttura esterna 
supplementare che permette di costruire tale isomorfismo è il prodotto scalare. 


L’assiomatizzazione delle proprietà caratteristiche di questo esempio con- 
duce all'importante concetto di applicazione e forma bilineare su uno spazio vet- 
toriale. L’isomorfismo di uno spazio con il suo duale in tale contesto si realizza 
abitualmente mediante forme di una fra due classi: ortogonale o simplettica.. 

Applicazioni ‘bilineari. 

Siano L, M, N spazi vettoriali. L'applicazione f: Lx M+N si dice bilinea- 
re se è lineare in ciascuno dei due argomenti /e L, me M, quando l’altro è 
fissato. Un esempio è l'applicazione bilineare canonica L* x L+A:(1*,0)+/#(1). 
Nucleo sinistro (risp. destro) di un’applicazione bilineare f:Lx M+N si dice 
l'insieme di quei vettori Je L (risp. me M) tali che f(),m)=o per ogni me M 
(risp. per ogni Ze L). Un’applicazione bilineare f si dice (algebricamente) non- 
degenere (risp. non-degenere a sinistra, a destra), se entrambi i suoi nuclei 
(risp. sinistro, destro) sono uguali a zero. L'applicazione bilineare canonica 
L* x L-k è non-degenere. 
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L’applicazione bilineare f:LxM+k definisce un’applicazione lineare 
L+M*:1> {mHf(l,m)} e M+L*: mv {l-+f(l,m)}. Se f è non-degenere a si- 
nistra, L+M* è una immersione; se f è non-degenere a destra, M-+L* è una 
immersione. Da ciò segue che se f è non-degenere, le applicazioni L+M* e 
M-+L* sono isomorfismi. Essi sono mutuamente coniugati nel senso definito 
sopra, cosî che l’assegnare un’applicazione bilineare non-degenere f:Lx M>R 
è equivalente ad assegnare una identificazione L> M* oppure MS L*. 

Si consideri ora il caso in cui MM = L. Secondo quanto detto sopra, l’assegna- 
zione di un isomorfismo L> L* è equivalente all’assegnazione di un’applicazione 
bilineare non degenere LxL+A o forma bilineare sullo spazio L. Nello spazio 
euclideo si ha una forma bilineare canonica: il prodotto scalare di vettori; perciò 
lo spazio euclideo è identificato canonicamente con il suo duale, cosi come avve- 
niva nell'esempio portato sopra. 


Forme ortogonale e simplettica. 


La forma bilineare f:LxL+k può essere analizzata rispetto a un altro ti- 
po di simmetria: quella relativa alla permutazione dei suoi argomenti. Se 
F(04)=f(1, 1) per tutti gli 2, Le L, la forma si dice simmetrica; se invece 
f(l,,l)=—f(l, 1), si dice antisimmetrica e, nel caso non-degenere, simplettica. 
Una qualsiasi forma f si decompone nella somma di una componente simmetrica 
e di una antisimmetrica f,-+f..: 


fs (ty) =2(f(hy)+f(l 1) 


I 


Î-(hx; la) = 5) —f(l, L)). 


La teoria delle coppie formate da uno spazio L e da una forma non-degenere 
f assegnata su di esso viene detta geometria ortogonale (astratta) se f è simme- 
trica, geometria simplettica se f è antisimmetrica. Sebbene per noi al centro 
dell'attenzione si trovi l’identificazione di L con L*, definita da f, l'intuizione geo- 
metrica originaria si basa sulla rappresentazione di f(/,/) come «quadrato del- 
la lunghezza» del vettore sh in analogia con il caso euclideo 4=R, L=R?, 


Ff((%1, %9, xs), (£1,%2,%3)) = v x. Ciò conduce, per esempio, allo studio del grup- 


po dei movimenti dello n L, gli automorfismi lineari che conservano la 
«metrica » |||?=f(/,2), ecc. 

Sebbene storicamente la geometria ortogonale si sia trovata a lungo al cen- 
tro dell’attenzione, a poco a poco le strutture simplettiche si sono guadagnate 
un ruolo di parità e si riconosce il loro ruolo fondamentale proprio nelle si- 
tuazioni in cui oggetti duali sono congiunti in uno unico. 


Esempio: geometria simplettica su L*x ZL. Sia L uno spazio vet- 
toriale, L* il suo duale. La somma diretta L* x L consiste delle coppie (f,/), 
feL*, leL. Su L* x L si ha una forma antisimmetrica canonica non-degenere 


Di fol) (Sa lo))=f1(b)-fs(l). La restrizione di questa forma ai sotto- 
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spazi L.L*CL*xL è identicamente nulla. Inoltre L ed L* sono sottospazi 
massimali con questa proprietà. Si può dimostrare che ogni sottospazio a di- 
mensione finita //, su cui sia data una forma simplettica non-degenere, è iso- 
morfo ad uno spazio del tipo L* x L. La scelta di un tale isomorfismo equivale al- 
la scelta di due sottospazi lagrangiani complementari in M: i sottospazi di di- 
mensione massimale sui quali la restrizione della forma simplettica sia identi- 
camente nulla. 

Esempio: algebra di Grassmann. Siano & un campo e «,, ...,%, 
n variabili indipendenti su &. Si consideri un anello (non commutativo) A su 
k, generato da x,, ..., %,, con le relazioni anticommutative x;x;=—;x; per 
ogni î,j=1,..., (in particolare, x*=0). Se tutte le rimanenti relazioni sono 
conseguenza di queste e degli assiomi di k-algebra, allora A_ si chiama algebra 
di Grassmann con un sistema di generatori fissato x1, ..., xy. Sia AÎCA il sot- 
tospazio formato dai polinomi omogenei di grado î, A°=£. Si può verificare 
che la dimensione di A* è uguale a 


n\ n(n—-1).. MISE 
(a 
in particolare A%=kx,...%,, e Af= 0 per j>n. La moltiplicazione Aîx AA" 
definisce una forma bilineare non-degenere 9;: ab= ;(2,b)x,...xn, ove acA', 
beA"-i, Perciò A° s’identifica con (A-‘)*. Sulla parte «dispari» dell’algebra 
A25H1 la forma @y;,, è antisimmetrica se n è pari, sulla parte pari A?* è simmetrica. 

L’algebra di Grassmann senza generatori fissati può essere definita come 
l’algebra generata dalle applicazioni multilineari antisimmetriche 


f:Lx...XL>k, 
i 
dove L è uno spazio a dimensione finita. Essa si indica con AL*. 
Nei modelli fisici i polinomi commutativi e anticommutativi corrispondono 
a particelle elementari con statistiche diverse: bosoni e fermioni. La teoria uni- 
ficata di entrambi i tipi di particelle richiede l’esame di algebre una parte dei 
cui generatori è commutativa, mentre l’altra è anticommutativa, e dell’interes- 
sante nuovo apparato della «supersimmetria ». 


Nella geometria e nella topologia differenziali hanno un ruolo importante le 
varietà differenziabili X sui cui spazi tangenti 7, X, xe X, siano date strutture 
del tipo del prodotto scalare, che variano in modo liscio con x. 

La regolarità rispetto ad x qui e nel seguito va intesa nel modo seguente: 
l’unione di tutti gli spazi tangenti TX=|\J7,.X può essere dotata di una strut- 


ce 
tura di varietà differenziabile in modo tale che la proiezione 7: TX+X (che 
ad un vettore tangente nel punto x associa il punto si: sia un’applicazione liscia. 
Un’osservazione analoga si può fare per 7*X= AI TX xxTX= UT Xx 


x T,X), ecc. TX prende il nome di fibrato une ad X, e T*X di brio co- 
tangente. 
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Una sezione liscia dell’applicazione 7: TX+X si chiama allora campo vet- 
toriale, una sezione liscia di 7*: T*X-_X, forma differenziale (di grado 1) su 
X. Gli spazi D(X) dei campi vettoriali, e Q!(A) delle forme differenziali sono 
lineari e ad infinite dimensioni; su di essi è definita un’applicazione bilineare 
canonica D(X) x QX) +C°(X) nello spazio delle funzioni lisce, cioè dei cam- 
pi scalari su X. 

Se sulle fibre di 7.X è data una forma ortogonale (risp. simplettica) non- 
degenere che dipende in modo liscio da x, allora X viene detta varietà pseudorie- 
manniana (risp. simplettica). 

Una varietà pseudoriemanniana si dice riemanniana se tale forma è defi- 
nita positiva. Su una varietà pseudoriemanniana, in un sistema locale di coordi- 
nate (x, ..., x”), il «quadrato della lunghezza » di un piccolo vettore tangente 
con origine in (1, ..., x*) e fine in (x1+dx!, ..., x*+dx"), per tradizione si in- 
dica con ) g;;dx'dx!. 


Esempio: strutture riemanniana e simplettica in meccanica. 

Sia X lo spazio delle configurazioni di un sistema meccanico, TX il suo fi- 
brato tangente. Se (91, ..., g,) sono coordinate locali su X, le coordinate locali 
su TX si esprimono in genere nella forma (4, ..., n» dr +» dn): nel vettore tan- 
gente ge T,X il valore di g; è uguale a g;(x), e il valore di g; è uguale a Eg;. 
L’energia cinetica del sistema spesso ha la forma Y° ai;(4 + In) did cioè di- 
pende quadraticamente dalla velocità. Se questa forma è positiva e non-dege- 
nere, essa definisce una metrica riemanniana Y'a;;dg;dg; sullo spazio delle con- 
figurazioni X. 

Le equazioni di evoluzione del sistema in forma hamiltoniana si scrivono 
per una traiettoria nello spazio delle fasi di questo sistema, che è definito come 
il fibrato cotangente T*X. Queste equazioni si scrivono in termini della struttura 
simplettica canonica su 7*X. Il meccanismo della sua costruzione è analogo a 
quello del caso L* x L: lo spazio lineare M=7,(7*X) contiene T#X, dove x 
è l’immagine di y su X, in qualità di sottospazio, e lo spazio quoziente rispetto 
ad esso è isomorfo a T, X. L'assenza di una decomposizione diretta è compen- 
sata dalla condizione che la forma simplettica sia liscia e chiusa. 

Questa forma simplettica ba un ruolo fondamentale nella formulazione delle 
equazioni di evoluzione della meccanica hamiltoniana. 

Esempio: dualità di Poincaré. In topologia si ha una serie di co- 
struzioni che permettono di associare a uno spazio topologico X e a un campo 
k il suo anello di coomologia a coefficienti in &: H*(X, &). Per esempio, se X è 
una varietà differenziabile, #=R, si può considerare il cosiddetto complesso di 
De Rham su X. Esso è una successione di spazi lineari (2° (le sezioni lisce 
del fascio A'T*X) e di applicazioni dj: QiX+Q%1X, che qui non si definiran- 


no. Allora per definizione H*(X, R) =-© H'(X,R)e H'(X,R)= Kerd;/Imd;, 
=0 


La moltiplicazione in H7*(X,R) è indotta dalla moltiplicazione grassmannia- 
na, o esterna, in A*T*(X). Se = dim X, e X è connesso ed orientato, allora 
H"(X)=R, e la scelta di questo isomorfismo definisce una forma bilineare 
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non-degenere H*(X)x H"-i(X)+R, che fornisce anche uno degli aspetti della 
dualità di Poincaré: Hi(X)=(H®-:(X))*. Non si può qui accennare all’altro 
aspetto, la dualità fra coomologia ed omologia, ed anche alle sue molteplici 
varianti e generalizzazioni. 


Algebra tensoriale e dualità. A partire da due spazi vettoriali L ed M, se ne 
può costruire un terzo, il loro prodotto tensoriale L®M. Questa costruzione ha 
un ruolo sempre crescente nella matematica contemporanea. Oltre alle appli- 
cazioni classiche nella teoria delle rappresentazioni e nella geometria differen- 
ziale, i prodotti tensoriali sono stati molto usati nell’algebra commutativa: un 
prodotto tensoriale di anelli si trasforma nel prodotto diretto dei loro spettri 
nella categoria duale (cfr. $ 2). Il formalismo dei prodotti tensoriali viene usato 
in modo essenziale nella descrizione quantistica dell'unione di più sistemi: la 
funzione d’onda di un sistema unione di più sistemi appartiene allo spazio pro- 
dotto tensoriale degli spazi delle funzioni d’onda relative alle sue parti. 

In questo paragrafo si descriverà il linguaggio tensoriale della geometria 
differenziale classica e si illustrerà il ruolo della dualità lineare in operazioni 
sui tensori quali l'abbassamento o innalzamento degli indici e la contrazione. 


Definizione di prodotto tensoriale. 


Siano L, M due spazi vettoriali sul campo &. Si consideri lo spazio N, 
con base {(/, m)}, dove fe L, me M sono tutte le possibili coppie di vettori. 
Nello spazio N si consideri il sottospazio N, generato dagli elementi (al, m)— 
—a(l,m), (l+4,m)-(L,m)-(l,m), dove aek; I,l;jeL, me M; e, analoga- 
mente, dagli elementi (Zbm)—b(/m), (2m,+m,)—(4m)—(1 my). Posto 
L®M=N/N, si definisce l’applicazione canonica Y:Lx M+L®M, x(l,m)= 
= classe (7,m) mod N, =/®@m. 

L'applicazione y è bilineare e gode delle seguenti proprietà generali: per 
ogni applicazione bilineare p:LxM-+N esiste un’unica applicazione lineare 
V:L@M+N tale che p=yoy. 


Proprietà elementari. 


Se (;), (;) sono basi di L, M, allora il sistema (l;®w,) forma una base di 
@M. 


Sono definite le identificazioni canoniche di L®M con M@L: /®@m-mQ®1 
e di (L@M)®N con L®(M®N): /®(m®n)+(/®m)®n, che esprimono la 
commutatività e l’associatività del prodotto tensoriale. 

Ha luogo anche l'importante isomorfismo canonico di spazi vettoriali (nel 
caso a dimensione finita), funtoriale rispetto ad L, M (cfr. $ 2): Hom(L, M)= 
=L*®M. All’elemento l*@meL*@M esso associa l'applicazione lineare 
L>M:141*(1)m. Si scriverà L®? in luogo di L®...®L (? volte). 


Tensori. 


Un elemento dello spazio L®@L*® si chiama tensore sullo spazio L, f 
volte covariante e g volte controvariante, di rango p+g. L'intera somma 
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2. Ro @L*® si dice algebra tensoriale su L (la moltiplicazione è quella ten- 


soriale, con l'evidente commutatività dei fattori). 

L’assegnare una forma non-degenere w:LxL-& definisce sull’algebra 
tensoriale su L tutta una serie di strutture, che qui ora si elencherà con la no- 
menclatura classica. Sarà evidente che il ruolo di + consiste proprio nel fissare 
un isomorfismo tra L e L*. 


Tensore metrico. 


E la stessa forma ©, considerata come tensore di (L®L)* “L*@®L*. Que- 
sta denominazione in genere si usa quando ® è simmetrica (su R). 


Innalzamento e abbassamento degli indici. 


Dal momento che © definisce un isomorfismo tra L e L*, allora, sostituen- 
do nel prodotto tensoriale L®L®...@L*®L*®... alcuni dei fattori L con L* 
e viceversa, si ottiene una serie infinita di isomorfismi fra spazi di tensori, che 
non cambiano il rango totale. Tutti questi isomorfismi vengono detti innalza- 
menti e abbassamenti di indici, in conformità con la tradizionale notazione in 
termini di basi. Invero, se {/;} è una base di ZL, con {li} si indica abitualmente 
la sua immagine in L* rispetto all’isomorfismo scelto, e allora le operazioni 
d'innalzamento ed abbassamento degli indici trasformano, ad esempio, /,@/, 
in /,@/?, !!®l, in !@??, ecc. In tal modo ogni tensore, grazie alla forma ©, 
ottiene un'esistenza in diverse «ipostasi » che differiscono per i gradi di co- e 
controvarianza. In particolare il tensore metrico © può essere considerato non 
solo come elemento di L*®@L*, ma anche di L®@L* o di L@L. 


Contrazione. 


La forma bilineare simmetrica L*x L+A definisce un’applicazione lineare 
L*@®L-+hk. Scegliendo nel prodotto tensoriale L®L®...@L*... due termini 
L e L* (non necessariamente consecutivi), e applicando ad essi quest’applica- 
zione lineare, si ottiene un’applicazione nei tensori di rango inferiore, detta 
contrazione rispetto alla corrispondente coppia di indici, uno in alto e l’altro 
in basso. Per esempio, la contrazione porta /;@l' in 1, e /;@/ (per î#j) in o. 


Esempio fondamentale. 


Sia X una varietà differenziabile, TX il suo fibrato tangente. Nella teoria 
classica si chiamano tensori di rango (), 9) su X le sezioni del fibrato 7?:1(X)= 
= UU (7,X)9P@(T*X)®, cioè i campi di tensori su 7, X che variano in modo 
liscio con x. L'assegnazione su X di una struttura (pseudo)riemanniana defini- 
sce un’identificazione fibra per fibra di 7,X con T*X, e le corrispondenti ope- 
razioni di contrazione e d’innalzamento ed abbassamento di indici. 

Se (x, ..., x*) è un sistema di coordinate locali su X, allora i campi vettoriali 


dè 
dx” da, 
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formano una base locale in 7, X, ed i differenziali (dx,, ..., dx,) formano una ba- 
se locale in T*.X. La notazione classica dei tensori è la notazione in termini delle 
loro coordinate in tali basi. Ad esempio, se f è una funzione su X, allora df è una 
sezione tensoriale in T*X; nella notazione classica, (df/dx*) dx. 

Si osservi in conclusione che si sono introdotti i concetti fondamentali del- 
l’algebra tensoriale, ma non si è affrontata l’analisi tensoriale (connessione, cur- 
vatura, integrazione di forme, ecc.), in cui non è sufficiente considerare i ten- 
sori in ogni punto x separatamente, ma sono essenziali le proprietà delle loro 
variazioni con x. 


Dualità e convessità. 


Dualità di Legendre-Young. 


Sia L uno spazio vettoriale a dimensione finita su k, e L* il suo duale. Si scri- 
verà (4, )) invece di g(p) per ge L*, peL. 

Le funzioni f: LR e g:L*+R si dicono duali secondo Young se per ogni 
punto qgeL* (risp. poe L) esiste un unico punto pre L (risp. qge L*) tale che 
f(o)+£(40)= (4020). In una versione più ristretta della definizione, questa 
condizione può essere soddisfatta solo quando (9, 0) varia in un sottoinsieme 
di L* x L. 

Nelle applicazioni il caso più importante è quello in cui A=R. 

Sotto alcune condizioni su f si può dimostrare che la funzione ad essa duale 
£ esiste, è unica, e soddisfa le stesse condizioni. Un esempio di tali condizioni 
è che f sia una funzione liscia e la regione {(x,y) | y=f(x)} CL xR sia convessa, 
cioè contenga, insieme con due qualsiasi punti, tutto il segmento che unisce 
tali punti. 

In tale caso f e g si chiamano trasformate di Legendre l’una dell’altra. Tali 
sono le coppie g%/x, 8/8 per a,B>1, (1/x)+(1/8)=1 (nella regione g>0, p>0). 

L’assegnare una coppia di funzioni duali secondo Young f, g definisce un’ap- 
plicazione biiettiva molto importante, ma in generale non-lineare: 


L>L*:QPo se f(Po) +£(90) = (40 do). 


Esempio. Sia X lo spazio delle configurazioni di un sistema meccanico. 
La legge di evoluzione di questo sistema può essere data sia mediante la sua 
lagrangiana £, sia mediante l’hamiltoniana I. La prima è una funzione 
£: TX +R, la seconda una funzione 5: T*X+R. Per ogni xe X le restrizioni 
di £ a T,X e di IX a TEX rispettivamente costituiscono le trasformate di 
Legendre l’una dell’altra. La traiettoria del sistema in TX si trasforma nella 
sua traiettoria in T*.X, in seguito alla trasformazione sulle fibre T,X>TXX 
descritta sopra. Nei casi più semplici la lagrangiana di un sistema è la differenza 
fra le sue energie cinetica e potenziale, e la hamiltoniana la loro somma. 


Dualità delle figure convesse. 


Sia di nuovo L uno spazio lineare a dimensione finita su R, ECL un insie- 
me convesso chiuso contenente o come punto interno. L'insieme E*={peL*| 


145 Dualità 


VqeE, (9, p)}<1} CL* si dice il duale di E. Se L è euclideo, in particolare è 
identificato canonicamente a L*, allora E*, come sottoinsieme di L, si dice 
polare di E. 

Nel $ 3 si vedrà che gli insiemi convessi sono usati per definire una topolo- 
gia negli spazi ad infinite dimensioni, ed i loro duali definiscono la topologia 
corrispondente nello spazio duale. 


Semilinearità e particolarità del caso complesso. Nel campo dei numeri com- 
plessi C si ha un unico automorfismo continuo non-banale: la coniugazione 
complessa. Nell’algebra lineare su C risulta assolutamente essenziale seguire 
l’azione della coniugazione complessa su tutti gli oggetti che s'incontrano. 
Ecco alcune definizioni. 

Siano L, M due spazi vettoriali su C. Un’applicazione f:L+M si dice 
semilineare se f(1,+/)=f(4)+f(4) e f(@l)=df(1) per qualsiasi aeC; ZL, 
l,eL. Una terminologia analoga si adopera per le applicazioni dipendenti da 
più argomenti vettoriali. Le forme che dipendono da due argomenti, linear- 
mente da uno di essi e semilinearmente dall’altro, si chiamano sesquilineari. 


La forma sesquilineare non-degenere (x, y)= ) x;; su C” possiede le pro- 


prietà essenziali della metrica euclidea su R”, quali la realtà e la positività del 
quadrato della lunghezza di ogni vettore. Limitandosi alle forme bilineari sa- 
rebbe stato impossibile ottenere ciò. 

Sia L uno spazio vettoriale su C, e L+%= L*, L®!= spazio delle applicazioni 


semilineari di L in C. Lo spazio $ (L1:0 x L0:1)® appartiene all’algebra tenso- 
n=0 


riale ampliata di L: esso consiste dei tensori che si trasformano semilinearmente 
rispetto a certi indici, con un cambio del sistema di coordinate. 

Applicando questa costruzione alle forme differenziali su una varietà com- 
plessa, si arriva all'importante concetto di forma di tipo (?, g) (per esempio, 
d3,...d%p, d$,...4Z,) e di decomposizione di Hodge. Qui non c’è spazio per at- 
tardarsi su queste più precisamente. 


1.3. Gruppi abeliani finiti e loro caratteri. 


Gruppo dei caratteri del gruppo G. 


Sia G un gruppo, C' il gruppo moltiplicativo dei numeri complessi. Si dice 
carattere (unidimensionale, complesso, unitario) del gruppo G un omomorfi- 
smo Y: G+C' tale che |y(g)]=1 per ogni ge G. Se G è finito, quest’ultima 
condizione è soddisfatta automaticamente, poiché tutti i y(g) sono radici del- 
l’unità. Sull’insieme dei caratteri G* si ha una struttura di gruppo abeliano 
con moltiplicazione yixs(g)=y1(2)%s(£). 

Fissiamo ge Ge consideriamo l'applicazione f.(g) : G*+C, tale che y>y(£). 
Si vede facilmente che questa è un carattere di G*, cioè appartiene a G**. L’ap- 
plicazione risultante B : G-+G** è un omomorfismo di gruppi. Come nel caso 
della dualità lineare, si ha: L'applicazione canoriica B: G+G** è una immer- 
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sione se e solo se G è un gruppo abeliano, ed è un isomorfismo se e solo se G 
è un gruppo abeliano finito, 

L'immagine di f} è sempre un fattore abeliano massimale di G**, perciò 
nelle costruzioni di dualità dei gruppi non commutativi occorre utilizzare nuovi 
principî. D'altra parte f} è un isomorfismo anche per la più ampia classe dei 
gruppi abeliani topologici localmente compatti, se si considerano solo i caratteri 
continui. Questo è l'oggetto della teoria della dualità di Pontrjagin (cfr. $ 3). 

L'affermazione sull’isomorfismo f} si dimostra facilmente, tenendo conto del 
fatto che un gruppo abeliano finito si decompone nella somma diretta di sotto- 
gruppi ciclici. Supponiamo dapprima che G sia ciclico di ordine d con gene- 
ratore g. Allora ye G* è definito univocamente dalla radice dell’unità y(g), che 
può essere di un ordine qualsiasi che divide 4. Ciò implica che l'ordine di G* 
è uguale a d, come per G. Inoltre, se he G è un elemento diverso dall’identità, 
allora esiste sempre un yeG* con y(4)341 (ad esempio, un y tale che y(£) 
sia una radice primitiva dell’unità di ordine d). Perciò l’immagine di 4 in G** 
è non-banale. Ciò significa che l’omomorfismo G+G** ha un nucleo banale e, 
dal momento che gli ordini dei gruppi G e G** coincidono, esso è un isomor- 
fismo. È facile passare al caso generale, costruendo l’isomorfismo canonico 
(G1x Gy)*=G#x G*: qui G# è l’insieme dei caratteri di G, x G», banali su 
G., e viceversa. 

Sia g:G-+H un omomorfismo di due gruppi abeliani finiti. Si definisce a 
partire da questo l’omomorfismo coniugato @*:H*-G*, che al carattere 
x: H+C"' associa il carattere yog: G+C'. Applicando l’operazione di coniu- 
gazione ancora una volta, si ottiene l’omomorfismo @**:G**+ H**. Come 
nel caso della dualità lineare, si ha: In seguito all’identificazione di G** con G 
e di H** con H mediante £, l’applicazione 9** s’identifica con g. 

Le successioni esatte di gruppi abeliani si definiscono esattamente come le 
successioni esatte di spazi vettoriali. Di nuovo, come nel caso della dualità li- 


p . i . es a d x x 
neare, si ha: Se la successione di gruppi abeliani finiti FS G3 H è esatta in G, 


allora la successione H7*% G*% F* è esatta in G*. 

Siano G, H due gruppi abeliani. L'applicazione f:Gx H+C' si dice ac- 
coppiamento (a valori in C') se essa è un omomorfismo nel primo argomento, 
per un valore fissato del secondo, e viceversa. Per esempio, si ha l'accoppiamento 
canonico G*x G+C':<y,gY>y(£). Come nel caso lineare, si definiscono i 
nuclei destro e sinistro dell’accoppiamento, e gli accoppiamenti non-degeneri. 
In modo analogo si dimostra che l'assegnazione di un accoppiamento non- 
degenere f:Gx H+C' di gruppi abeliani finiti è equivalente all'assegnazione 
di un’identificazione G>.H* e H3G*. 

Seguono alcuni esempi importanti per l’algebra e la teoria dei numeri. 


Dualità di Kummer. 


Sia £ un campo contenente le radici dell’unità di periodo #>1I, dove n è un 
numero naturale che non divide la caratteristica del campo &; e K/R un’estensione 
finita di Galois con gruppo abeliano G di periodo n. Si consideri nel gruppo 
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moltiplicativo £' del campo & il sottogruppo L', formato dagli elementi che so- 
no potenze n-esime in K. Evidentemente (k')° CL. Si pone H=L'/(k')? e si 
definisce l'applicazione G x 7 +’ mediante la formula <g,a(£'Y)) Pe/aW{7/a. 
In altre parole, si estrae da @ la radice di grado x nel campo K, e si osserva 
per quale radice dell’unità si moltiplica il suo automorfismo ge G del gruppo 
di Galois del campo K. Si dimostra facilmente che quest’applicazione è un ac- 
coppiamento (a valori in &'). Un aspetto più sottile è il fatto che esso è non- 
degenere e definisce la dualità di Kummer fra il gruppo di Galois G e un sotto- 
fattore del gruppo moltiplicativo &' del campo di base. 

Questa costruzione è del tutto generale; invero essa non usa in nessun modo 
le proprietà specifiche del campo di base. Applicandola a campi particolari 
si ottengono, per esempio, l’accoppiamento di Weil (per i campi di funzioni 
abeliane), o il simbolo di Hilbert del residuo normato. 


Residui normati. 


Sia Q, il campo dei numeri p-adici. Esso, come ogni campo, contiene 1, 
la radice dell’unità di grado 2, e il gruppo H=Q,/Q} è finito. La dualità di 
Kummer definisce un accoppiamento non-degenere Gx Q/Q- {+1}, dove 
G è il gruppo di Galois dell’estensione abeliana massimale di Q, di periodo 2, 
ottenuta aggiungendo a Q, le radici quadrate di tutti i suoi elementi. 

D'altra parte, si definisce l'applicazione Q,/0 x Q/Q7+ {+1}, ponendo 
per a,beQ, 


. +1 se ax°?+by?—2°=o per alcuni x,y,zeQ,, 
(407, bQ7)= (4,8), = non tutti nulli; 
—I1 altrimenti. 


Questo è il simbolo di Hilbert, che costituisce un accoppiamento non-degenere. 
Esso è contemporaneamente simmetrico e antisimmetrico: questi due concetti 
coincidono per accoppiamenti a valori nei gruppi di periodo 2. 

In tal modo deve esistere un isomorfismo Q/Q + G, dove G è il gruppo abe- 
liano di Galois, introdotto sopra, della estensione di Q,. In effetti secondo 
Kummer G=(0,/Q7)*, e secondo Hilbert Q,/0;7 = (0;/0}7)*. 

Tale isomorfismo effettivamente esiste e può essere costruito indipendente- 
mente in una situazione molto più generale. Invero, sia £ un'estensione finita 
del campo Q,, Gy il gruppo di Galois dell'estensione abeliana massimale di 
questo campo. Allora esiste un isomorfismo « : &'+G, che è un’immersione con 
immagine densa, e «quasi» un isomorfismo di gruppi abeliani topologici, nel 
senso che sui gruppi quoziente finiti esso induce un isomorfismo. Più precisa- 
mente, se KDA è un'estensione abeliana finita e HÉ CCG, è il sottogruppo degli 
automorfismi banali su K, allora « induce un isomorfismo ag : #'/Ng,(K')S 
> G;/H® (= gruppo di Galois di K/k). Questo è l’isomorfismo della teoria lo- 
cale dei corpi di classe. o ì 

Se lo stesso & contiene le radici dell’unità di ordine n, e K/k è un’estensione 
abeliana massimale di periodo 7, con gruppo di Galois G, allora Ng,x(K°)=(k'), 
e «x induce un isomorfismo di 4'/(k°)" con G, cioè con il gruppo duale di 
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k'[(k°Y" secondo Kummer. In tal modo la teoria dei corpi di classe realizza la 
sintesi di un certo oggetto con il suo duale e perciò, come è consueto in tali casi, 
è altamente significativa. ; 

I tentativi di generalizzare questi risultati al caso del gruppo di Galois com- 
pleto della chiusura algebrica di un campo locale £ hanno condotto negli ultimi 
anni alla formulazione delle importanti ipotesi di Langlands. In questa teoria 
«non commutativa » dei corpi di classe il posto dei caratteri del gruppo di Ga- 
lois è occupato dalle sue rappresentazioni lineari di dimensione finita, e il posto 
dei caratteri del gruppo moltiplicativo del campo dalle rappresentazioni di di- 
mensione infinita dei gruppi di matrici su questo campo. Alcuni di questi con- 
cetti, in termini dei quali si formulano le dualità non commutative, saranno spie- 
gati in seguito (cfr. anche il $ 3). 


1.4. Gruppi non abeliani finiti e dualità. 


Linearizzazione. Le note costruzioni di dualità per gruppi non necessaria- 
mente commutativi si basano su oggetti che unificano la struttura di gruppo 
con la struttura lineare. Due tipi fondamentali di tali oggetti sono l’anello di 
gruppo del gruppo G e le rappresentazioni lineari del gruppo G. Nel seguito si 
considererà G come gruppo finito; per il caso più generale, si veda il $ 3. 


Anello di gruppo. 


Sia & un campo; l'anello di gruppo k[G] del gruppo G è lo spazio vettoriale 
delle funzioni su G a valori in £ con la moltiplicazione data dalla convoluzione 
(ax b)(g) mg): Se si esprime una funzione 4€ek[G] nella forma 


Yale)g, immergendo G in R[G] mediante l’identificazione g+d, (dove d,(41)= 
geG 


=1 per h=g, e 0 per 46g), allora la convoluzione è compatibile con la moltipli- 
cazione in G: è,*3,= dp. In seguito si mostrerà come, in termini di anelli di 
gruppo, si formuli una delle varianti della dualità. 


Rappresentazioni lineari. 


Sia L uno spazio vettoriale sul campo k, e sia G/(L) il gruppo degli operatori 
lineari invertibili L-+L. Si dice rappresentazione del gruppo G sul campo & 
un omomorfismo T:G-+G/(L); la dimensione di L si dice dimensione della 
rappresentazione. L'ARNIO l 

Siano T;:G-+GI(L;), i=1,2, due rappresentazioni. Si dice morfismo di 
T, in T, un'applicazione lineare @: ZL, +L, tale che 1 (71 (95)= T,(g)e(2) 
per Ze L, e ge G arbitrari (cioè un'applicazione compatibile con le azioni di 
su L, e L3). Due rappresentazioni T; e 7, sono equivalenti o isomorfe se esiste 
un morfismo di 7, in 7, che sia un isomorfismo lineare. Si dice somma diretta 
delle rappresentazioni 7, e 7, la rappresentazione T=T,@ 7, in L,® Lo per 
la quale T(£)(4,4)=(7(g)h,T(£)L) per l,eL, LeLs. In modo analogo si 
definisce il prodotto tensoriale T= 7) ® 7, in L\@L,. Se 7 è una rappresenta- 
zione di G nello spazio L, e MCL è un sottospazio G-invariante, cioè un sotto- 
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spazio tale che T(g)meM per ogni me M, geG, allora la restrizione di T ad 
M:g-T(g)lw si dice sottorappresentazione di T. In modo evidente si defi- 
nisce anche la rappresentazione quoziente di T su L/M. Se 7 non ammette sot- 
torappresentazioni non-banali, essa si dice (algebricamente) irriducibile. 

Ad ogni carattere y : G+C' corrisponde una rappresentazione unidimensio- 
nale (e perciò irriducibile) di G in C: gr moltiplicazione per y(g). Inversamen- 
te, ogni rappresentazione unidimensionale di G definisce un omomorfismo 
x: G+C' dipendente solo dalla classe di questa rappresentazione, a meno di iso- 
morfismi. Essa sarà senz'altro un carattere se G è finito. In tal modo G* è identi- 
ficato canonicamente con l’insieme delle classi di rappresentazioni unidimen- 
sionali del gruppo G. Questa osservazione è a fondamento di quella variante 
della dualità nella quale, come oggetto duale al gruppo G, si considera l'insieme G 
di tutte le possibili classi di rappresentazioni irriducibili del gruppo G: per ul- 
teriori dettagli si veda il $ 3. 


Algebre, coalgebre e bialgebre. Uno spazio vettoriale L su un campo & si 
dice k-algebra (centrale) se su di esso è data una struttura di anello (non neces- 
sariamente commutativo) con unità 1, e se l’applicazione R+-L:@aHw>a-1 è un 
omomorfismo di anelli, la cui immagine commuta con tutto L. La moltiplica- 
zione in una &-algebra L può essere considerata come un’applicazione lineare 
m:L®L+L,m(l,@1,)=1L. Tutti gli assiomi di k-algebra possono essere for- 
mulati in termini di commutatività di diagrammi di applicazioni lineari. 

Uno spazio vettoriale L su &, con una data applicazione lineare strutturale 
(comoltiplicazione) p1:L+L®L si dice coalgebra se y soddisfa gli assiomi 
ottenuti dagli assiomi per m invertendo tutte le frecce. Un’altra possibile defi- 
nizione è la seguente: ((L, u) è una coalgebra se (L*, p*) è un’algebra con mol- 
tiplicazione p*:(L@L)*=L*@L*-L*). I morfismi di algebre e coalgebre, 
ed i loro prodotti tensoriali, si definiscono in modo evidente. 

Infine, uno spazio vettoriale L dotato di moltiplicazione m e di comoltiplica- 
zione u si dice bialgebra se (LZ, m) è un’algebra, (L, p.) una coalgebra, p:L-> 
+L®L un morfismo di algebre, e m:L®@L+L un morfismo di coalgebre. 

La simmetria completa di tutte le condizioni su m, u ed il loro carattere 
(multi)lineare permettono di verificare automaticamente i seguenti principî di 
dualità: se L= (L, yu, m) è una bialgebra a dimensione finita, allora anche 
L*= (L*, n*, y.*) è una bialgebra a dimensione finita; si ha un isomorfismo 
canonico L=L**; per ogni morfismo di bialgebre p:L-+M è univocamente 
definito un morfismo p*:M*+L*, tale che (poy)*=4*09* e p**= g. 

Il ruolo di queste costruzioni nella teoria dei gruppi finiti è definito dal 
fatto che l'anello di gruppo k[G] di un gruppo arbitrario G è una bialgebra con 
la moltiplicazione definita sopra, e la comoltiplicazione u(a)(g,4)= a(£) seg=A, 
zero altrimenti. i ; 

Dal momento che in k[G] si ha una base particolare {3,}, possiamo identi- 
ficare canonicamente lo spazio &[G]* con k[G]; ciò definisce su #[G] una cop- 
pia duale di moltiplicazione e comoltiplicazione. Queste saranno la moltiplica- 
zione (puntuale) degli elementi di A[G] come funzioni su G e la comoltiplicazione 
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u(a)(g,h)=a(g,h). In altre parole, l'origine della convoluzione in &[G] è la 
seguente: la moltiplicazione nel gruppo Gx G+G definisce un’applicazione 
degli spazi di funzioni R[G] +A[G x G]= A[G]®4[G], dopo di che questa viene 
dualizzata e A[G]* s’identifica con A[G]. 

Qui, invece di £[G], si sarebbe potuto prendere un altro funtore controva- 
riante dalla categoria dei gruppi nella categoria degli anelli (cfr. $ 2), per esem- 
pio l'anello di coomologia per un gruppo topologico G. In tale contesto questa 
costruzione è stata considerata per la prima volta da Hopf, cosicché le bialgebre 
e le loro varianti si chiamano anche algebre di Hopf. 

Se G è un gruppo abeliano finito, si possono identificare canonicamente le 
bialgebre A[G]* e A[G*]. Questa identificazione si effettua mediante la seguente 
trasformazione di Fourier: a+4: d(y)=)@(e)y(£). Essa è stata scoperta per 


ge . . . . . 
la prima volta per i gruppi topologici G=C; e G=R (serie e integrali di Fou- 
rier), ed ha, in questa variante classica, numerose applicazioni (cfr. $ 3). Per i 
gruppi finiti G=Z/mZ essa conduce a considerare le somme trigonometriche 
a(g)e2ri/m, che dai tempi di Gauss fino ai nostri giorni sono oggetto di 


gqmodm , 2 u 7 } di 
studio in teoria dei numeri e rivelano sempre nuove proprietà profonde. Gauss ha 


calcolato tali somme per m primo e a(e)=(£)=+1 in dipendenza del fatto 


che g sia un quadrato mod m o no, e si è servito di questi risultati per dimo- 
strare la legge di reciprocità. In seguito (Davenport, Hasse, Weil, Serre, Deli- 
gne) si è chiarito che queste somme sono connesse con le rappresentazioni del 
gruppo di Galois del campo dei numeri algebrici e con le coomologie astratte del- 
le varietà algebriche. 

Se G è finito, ma non abeliano, allora la bialgebra #[G]* non è isomorfa alla 
bialgebra di gruppo di nessun gruppo. La categoria delle bialgebre a dimensione 
finita è sostanzialmente più grande della categoria delle bialgebre di gruppo: 
in effetti essa è tanto grande da essere chiusa rispetto al passaggio agli oggetti 
linearmente duali. La struttura dei suoi oggetti «spuri», a volte chiamati anelli 
di gruppo generali, con moltiplicazione e comoltiplicazione non commutative, 
è molto poco conosciuta. 


Dualità di Tanaka-Krein. Nella costruzione che ora esporremo, il ruolo di 
oggetto duale di un gruppo finito G è assunto dalla categoria R[G] di tutte le 
rappresentazioni a dimensione finita di G sul campo C. La seconda dualizza- 
zione, che permette di riottenere G a partire da R(G), si basa sul concetto di 
rappresentazione della categoria R(G). 

Si dice rappresentazione di R(G) una funzione  che'ad ogni oggetto di R(G), 
cioè ad ogni rappresentazione T: G+G/I(L) associa un operatore lineare inver- 
tibile g(T): LL con le seguenti proprietà: 


a) Sef: T,- Tyè un qualsiasi morfismo di rappresentazioni, allorafog(7,) = 
= (Ta)of. 
b) {(T,@T2)=/(T:)®f(T>). 
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La classe R(G)* delle rappresentazioni della categoria R(G) può essere do- 
tata della moltiplicazione 9193(7)=%;(T)0s(7). 

Ogni elemento ge G definisce una rappresentazione (g) della categoria R(G) 
mediante la formula B(g)T= 7°(g). L'applicazione ottenuta B: G+R(G)* è un 
isomorfismo di gruppi (teorema di Tanaka). Si descriverà ora brevemente co- 
me si estende questo risultato ad una classe più generale di gruppi topologici, e 
come si ottiene una descrizione astratta di tutte le categorie R(G) corrispondenti 
a questi gruppi. 

I gruppi finiti sono inclusi nella più ampia categoria dei gruppi topologici 
compatti (cfr. $ 3). La categoria R(G) per un gruppo compatto G si definisce 
come la categoria delle rappresentazioni complesse continue a dimensione finita 
di G. Il teorema di Tanaka sulla ricostruzione di G a partire da R(G)* si traspor- 
ta letteralmente a questo caso più generale. Inoltre appare la possibilità di definire 
in modo invariante la classe di categorie del tipo R(G). 

Invero Krein ha dimostrato che la categoria R degli spazi vettoriali a dimen- 
sione finita, chiusa rispetto ai prodotti tensoriali (di spazi e di morfismi) e al pas- 
saggio allo spazio (morfismo) duale, è equivalente ad R(G) per un opportuno 
gruppo compatto G se e solo se: 


a) Si ha un unico (a meno di isomorfismi) oggetto Z,€ R e un isomorfismo 
di funtori La®/d+Id. 

5) Ogni oggetto R si decompone nella somma di oggetti minimali. 

c) Se L, e L, sono oggetti minimali, allora Homg(L}, Ls) risulta o banale o 
uno pReA unidimensionale e, in quest’ultimo caso, L, e Ly sono R-iso- 
morfì. 


Negli ultimi tempi questo risultato è stato studiato in fisica teorica (Dopli- 
cher, Haag, Roberts). In diverse teorie dei campi svolge un ruolo importante 
il gruppo di gauge G. La scelta di questo nei casi concreti è condizionata in parti- 
colare dalle cosiddette regole di superselezione, che dànno informazione proprio 
sull’oggetto duale a G: R(G). 


2. Aspetti categoriali della dualità. 


Come si è visto nel $ 1, l'oggetto duale a uno spazio vettoriale o a un gruppo 
abeliano consiste delle applicazioni di questo spazio (gruppo) in un certo og- 
getto fissato. 

l Il punto di vista secondo il quale l’attenzione si sposta dalla struttura interna 
di un oggetto alla classe dei suoi morfismi verso altri oggetti viene detto catego- 
riale, in contrapposizione a strutturale. . 

Padroneggiando il linguaggio categoriale, possiamo esaminare un'intera ge- 
rarchia di dualità, a cominciare dai più semplici effetti di «inversione delle 
frecce » per finire con la poco formale complementarità « descrizione strutturale / 
categoriale degli oggetti matematici ». 

Già da tempo era stato notato che coppie di costruzioni come i limiti pro- 
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iettivi ed induttivi si trovano in una certa relazione di dualità: ciò si rifletteva 
nella vecchia terminologia «spettro diretto » e «spettro inverso ». Nella formu- 
lazione del linguaggio categoriale è diventato chiaro che, accanto a qualunque 
costruzione di un oggetto di una categoria mediante un diagramma di altri 
oggetti, è utile considerare la costruzione duale ottenuta per inversione di tutte 
le frecce nella definizione. Nonostante l’estrema semplicità di quest'idea, essa 
ha condotto rapidamente sia all’introduzione di nuovi concetti che alla miglio- 
re comprensione di vecchi. Per esempio, l'abbondanza di prodotti tensoriali di 
anelli nell’algebra commutativa degli ultimi decenni si spiega completamente 
con il fatto che l’inversione delle frecce (cioè il passaggio alla categoria duale 
degli spettri) trasforma il prodotto tensoriale nel prodotto diretto (o in quello 
fibrato). Il ruolo stesso dei prodotti diretti in un’arbitraria categoria diventa 
chiaro in analogia con il loro ruolo nella categoria degli insiemi dove i grafici 
delle funzioni, le leggi di composizione e molte altre strutture sono definiti in 
termini di prodotti. 

Seguendo l’azione dell’inversione delle frecce su una categoria globalmente, 
e non soltanto sui diagrammi singoli, si giunge alla questione delle connessioni 
della categoria con quella ad essa duale. La categoria duale C° può essere equiva- 
lente a quella iniziale C: tale è il caso della dualità degli spazi lineari a dimen- 
sione finita, o della dualità di Pontrjagin. La categoria duale può acquistare pro- 
prietà «geometriche » inaspettate, come accade con varie costruzioni degli spettri 
di anelli. Infine la categoria duale può ammettere una realizzazione indipendente, 
come nell’esempio classico della teoria di Galois. 

Il funtore Hom sul prodotto di una categoria e della sua duale, a valori nella 
categoria degli insiemi, è formalmente simile al prodotto scalare canonico 
LxL*-+k(L è uno spazio lineare su k). Estendendo questa analogia, Kan ha 
osservato che molti noti funtori si raggruppano in coppie i cui membri sono 
nella stessa relazione reciproca rispetto a Hom in cui si trovano le coppie di ope- 
ratori lineari coniugati. Ciò ha condotto ad una trattazione categoriale unificata 
di dualità differenti quali la dualità di Frobenius nella teoria delle rappresen- 
tazioni dei gruppi, e la dualità «sospensione /spazio dei cappi » in topologia omo- 
topica. 

Infine il confronto del linguaggio categoriale con quello strutturale rivela in 
essi le caratteristiche di una reciproca complementarità, tanto accentuata che 
gli specialisti di fondamenti della matematica considerano ora la possibilità di 
una costruzione alternativa dei fondamenti sulla base delle categorie, e non degli 
insiemi con struttura. Indipendentemente da ciò, per il topologo o per il geome- 
tra algebrico è già divenuta attuale la padronanza degli aspetti operativi di tale 
complementarità: le regole d’introduzione di una struttura su di un oggetto di 
una categoria, o il considerare, invece di un oggetto, il funtore che rappresenta 
questo oggetto. 

Questo paragrafo è dedicato al chiarimento di tutte queste idee per mezzo 
di esempi molto semplici. Per la definizione generale di categorie e di funtori, 
si rimanda il lettore al $ 6 dell’articolo « Applicazioni » di questa stessa Enciclo- 
pedia. Li sono anche portati i primi esempi di categorie e di costruzioni cate- 
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goriali, e nel $ 4 è contenuta la descrizione di una serie di strutture matematiche 
e di loro applicazioni. 


2.1. Inversione delle frecce. 


Sia C una categoria. Si ricordi che la categoria duale C° ha gli stessi og- 
getti di C: ObC=0ObC°, Si indichi con X°eObC® l'oggetto corrispondente 
a Xe ObC. Per definizione, Hompgo(X9, Y°)= Homeg(Y, X) e (fe)°=£0f0, do- 
ve f e g sono morfismi in C'e f°, g° i corrispondenti morfismi in C°, In altre pa- 
role, C° si ottiene da C' per inversione di tutte le frecce. 


Costruzioni duali. 


Supponiamo che in C' sia definita una costruzione, applicabile anche in C°. 
Allora essa, trasportata in C°, e considerata poi come costruzione su C, si chia- 
ma costruzione duale a quella iniziale. 


È Esempio. Si abbia in C un diagramma commutativo (quadrato) di mor- 
smi 


xe! 7 
[e] v 


SAGSE 


4 


Tale quadrato si dice cartesiano se per ogni oggetto su S: T-+.S l’applicazio- 
ne Homs(7,Z)>Homsg(7; X)x Homg(7, Y):gH(uog, vog) è bilettiva. Qui 
Homy sono i morfismi nella categoria Cg degli oggetti su S. In tal caso gli oggetti 


Z e u, v sono definiti da X3S ty univocamente a meno di isomorfismi, e Z 
viene detto prodotto fibrato (su .S) degli oggetti X, Y: Z=XxgY. 
La costruzione duale parte dal quadrato cartesiano 


x» Z 


o| È 


Sie 


v 


e definisce la somma disgiunta Z=X| |gY. Essa può essere espressa nel modo 
più rapido nella forma X[ [sY=(X°xg0Y°), utilizzando l’identificazione na- 
turale (C°)0=C. 

Ad esempio, nella categoria degli anelli commutativi con unità Ann, si ha 
AlJcB=A®cB (prodotto tensoriale di anelli su C). La categoria Ann° si chia- 
ma categoria degli schemi affini. Invece di A° si usa scrivere Spec A. In queste 
notazioni Spec 4 Xgneec SpecB= Spec(A®@cB). 
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ita u . . 

Esempio. Sia X:..-A_; da DX... oXy->... una successione di 

oggetti e morfismi nella -Gategnriò C. Si chiama morfismo di X nell'oggetto 
XeObC la successione di morfismi v;:X;+X tali che tutti i diagrammi 


Xi aa 
“\ /° 


siano commutativi. Supponiamo che un morfismo (03) : X-+4X sia universale 
nel senso che per ogni altro morfismo (w;): X-+ Y si abbia un unico morfismo 
w:X-+Y tale che il diagramma 


—_ (0,) 
>, aan cai 
\ V. 
Y 


sia commutativo nel senso evidente della parola. 
Allora (v;) e X sono definiti univocamente a meno di isomorfismi, e X si dice 
limite induttivo della successione X= (X;) nella categoria C: X=lim X,. 


La costruzione duale si chiama costruzione del limite proiettivo: : lim X;= 
= (lim Xp)°. 
Ad esempio, se p è un numero primo, X_,=Z/p"Z per n=o, X*=o per 


n20, U_n è l'applicazione di riduzione Z/p"Z-+Z|p"-!Z o zero per n=>o, allora 
lim X,= 27, è è l'anello degli interi p-adici. Si vede facilmente che lim X#= 


= -Q,/Z,, dove X# è il gruppo abeliano duale di X;, e il sistema (xt) si sì ottiene 
da (X;) applicando la dualità dei gruppi abeliani. 


Categorie autoduali. 


In alcuni casi importanti le categorie C' e C° risultano equivalenti. Questo 
concetto sostituisce il concetto più semplice, ma meno utile, di isomorfismo di 


: ; . F, P . 
categorie. Invero siano B, C due categorie, e Ba*C due funtori. I funtori F e G 
@ 


definiscono una equivalenza di B e C se i funtori GoF:B+B e FoG:C>C 
sono isomorfi al funtore identico (per il concetto di morfismo e di isomorfismo 
di funtori si veda l’inizio del $ 2.2). 

Una categoria C si dice autoduale se le categorie C' e C° sono equivalenti. 


Esempio. Le categorie FAb dei gruppi abeliani finiti, e FLin degli spazi 
vettoriali a dimensione finita sono autoduali. L'equivalenza è è realizzata dai fun- 
tori X+ (X*)° e Yo» Y* nelle notazioni dei $$ 2 e 3. In ciò consiste il contenuto 
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di tutti i principî di dualità descritti nei $$ 1 e 3. Anche la categoria LCAb dei 
gruppi abeliani topologici localmente compatti è autoduale (cfr. $ 3): in ciò 
consiste il principio di dualità di Pontrjagin. 


Realizzazioni importanti della categoria C°. 


Spesso accade che la categoria C° non sia equivalente a C, ma ammetta una 
costruzione indipendente da C. Alcune delle più profonde costruzioni matema- 
tiche si interpretano in modo naturale in questi termini. 


Esempio: teoria di Galois. Sia & un campo, È la sua chiusura al- 
gebrica. Per semplicità di formulazione limitiamoci al caso di caratteristica o. 
Allora il gruppo degli automorfismi del campo È su & è un gruppo topologico 
di Galois G, e la teoria di Galois stabilisce l'equivalenza fra due categorie: 


a) la categoria dei sottogruppi chiusi di G, con le inclusioni naturali quali 
morfismi; 

b) la categoria duale dei campi X, &RCKCÈ, con le inclusioni naturali quali 
morfismi. 


L’equivalenza si realizza mediante i funtori: (sottogruppo Y{CG)+ (cam- 
po degli elementi di È, invarianti rispetto ad H) e (campo K)+ (gruppo degli 
elementi di G che agiscono come l’identità su K). 

Esempio: dualità nelle algebre di Banach. Essa stabilisce l’e- 
quivalenza della categoria degli spazi di Hausdorff compatti con una certa sotto- 
categoria delle algebre di Banach commutative: si veda la formulazione precisa 
nel $ 3.3. 

Questo esempio è una delle note concretizzazioni della dualità generale geo- 
metria/algebra o spazio/funzioni su di esso. 

Un altro esempio è fornito dagli schemi affini di Grothendieck, che si rial- 
lacciano anche alla trattazione algebrica delle superfici di Riemann secondo Kro- 
necker-Weber. Nella costruzione di Grothendieck si vede chiaramente come la 
dualizzazione della categoria degli anelli commutativi riveli in essi delle possi- 
bilità geometriche del tutto inaspettate. Gli schemi affini Spec A diventano 
semplicemente degli oggetti geometrici locali, con i quali si possono comporre 
schemi globali, immergendo la categoria Ann°, che conserva ancora tracce della 
sua origine algebrica, nella categoria già completamente geometrica. di tutti gli 
schemi. La seconda caratteristica tipica della costruzione di Grothendieck è che 
in essa gli oggetti primitivi diventano le funzioni, e non lo spazio su cui esse sono 
definite; inoltre queste funzioni non sono neppure definite univocamente dai 
loro valori nei punti (i nilpotenti in A si annullano in tutti i punti di Spec A). 
Tale dualizzazione, come strumento di generalizzazione di strutture note, è un 
procedimento ampiamente diffuso. 


2.2. Funtori aggiunti. 


Siano F,G:C+C' due funtori. Si dice morfismo funtoriale, o trasforma- 
zione naturale p:F+>G una famiglia di morfismi gy: F(X)+G(X) nella ca- 
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tegoria C”, uno per ogni oggetto Xe ObC, tali che, se X 5 Yè unarbitrario mor- 
fismo in C, il diagramma 


Pe 
F(X) > G(X) 
F(1) G(1) 
i Cd era G(Y) 


è commutativo. La composizione di morfismi funtoriali si definisce in modo evi- 
dente. Il morfismo funtoriale identico, ad esempio F+ F, è la famiglia delle ap- 
plicazioni identiche F(X)+ F(X). Un morfismo funtoriale si dice isomorfismo 
se è dotato d’inverso destro e sinistro, cioè di quei morfismi che dànno il funtore 
identico per composizione con esso. 

Siano, ad esempio, Y, Y' due oggetti di C, w: Y+ Y' un morfismo, ky, ky, 
i due funtori da C° in Insiemi (la categoria degli insiemi) che rappresentano 
Ve vr. 

Allora i morfismi 


hy(X)= Homy(X,Y) 3 ky.(X)= Homo(X,Y): um 


uno per ogni XeObC, formano un morfismo funtoriale 4,,:hy+hy.. È facile 
vedere che 4,0,209=7w/wy 

Sia Funet (C, C) la classe dei funtori da C in C”. La si considererà come la 
classe degli oggetti di una categoria (con le stesse notazioni) i cui morfismi 
sono le trasformazioni naturali di funtori. Trascuriamo qui le questioni di teo- 
ria degli insiemi (la differenza fra insiemi e classi). Allora il risultato delle con- 
siderazioni precedenti si descrive nel modo più semplice come la costruzione 
di un morfismo canonico da un’arbitraria categoria C nella categoria C= 
= Funct(C°, Insiemi). Quest'ultima si chiama categoria dei prefasci di insiemi su 
C. Essa si ottiene da C' con una specie di duplice dualizzazione: il passaggio a C° 
e poi ai funtori nella categoria universale degli insiemi. 

Il funtore canonico C'+C': XH ky è pienamente fedele (pleinement fidèle): 
l'applicazione naturale Homg(X, Y)-Homg(4y,ky) è biiettiva. In particolare, 
l’immagine di C in C è una sottocategoria piena di È, equivalente a C. 

Una descrizione un po’ più simmetrica di questa stessa situazione si ottiene 
se si considera l’applicazione (X°, Y)+ Hom(X,Y) come bifuntore canonico 
C °x C+Insiemi, che ricorda formalmente l’accoppiamento di spazi vettoriali o 
di gruppi. Continuando in questa analogia, si considerino una categoria B e due 
funtori F: B+C e G: C+B. Questi funtori si dicono aggiunti l’uno all’altro se 
i bifuntori 


B° x C4Insiemi : (X°, Y) + Homg(F(X), Y) e (X0, Y)+Homg(X,G(Y)) 


sono isomorfi. Nelle notazioni F è aggiunto a sinistra di G, e G è aggiunto a de- 
stra di F. 
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Esempio. Nella categoria Insiemi è definito il prodotto diretto e, per ar- 
bitrari insiemi X, Y, Z, esiste l’identificazione canonica Hom(X, Hom(Y,Z))= 
=Hom(Xx Y,Z), che all'applicazione x+(f,: YZ) associa l'applicazione 
‘x, y)f,(y). Verificando tutte le necessarie proprietà funtoriali, ci si può con- 
vincere del fatto che il funtore X+XxY è aggiunto a sinistra del funtore 
ZH+Hom(Z,Y). 

Esempio. Analogamente, nella categoria degli spazi vettoriali a dimen- 
sione finita sono aggiunti i funtori X+X® Y e ZH Hom(Z,Y). 

Esempio: dualità di Frobenius. Siano G un gruppo finito, HCG 
un suo sottogruppo, R(G) e R(H) le corrispondenti categorie delle rappresen- 
tazioni finite sul campo & (cfr. $ 1.4). Restringendo ogni rappresentazione 
T:G+GI(L) al sottogruppo H, si ottiene una rappresentazione di H. Ciò de- 
finisce il funtore di restrizione res: R(G)+R(H). Inversamente, da ogni rap- 
presentazione U del sottogruppo H nello spazio L si può ottenere la cosiddetta 
rappresentazione indotta ind U del gruppo G. Questa si può realizzare, ad 
esempio, nello spazio delle funzioni f su G a valori in L per cui f(hg) = U(4)f(g) 
per ogni hell, geG. L’azione di G si definisce nella maniera seguente: 
[ind U(e)]f(21)=f(g12). Il teorema di dualità di Frobenius afferma (nella for- 
mulazione categoriale) che il funtore res è aggiunto a sinistra del funtore ind. 

Esempio. Sia Gr la categoria dei gruppi, G:Gr+Insiemi il funtore 
dimenticante della struttura di gruppo, che associa ad ogni gruppo il gruppo 
stesso come insieme. Il funtore aggiunto ad esso F': Insiemi + Gr esiste, e de- 
finisce per ogni insieme S il gruppo libero F(S) generato da questo insieme. 
In effetti gli insiemi Homg,(F(S), 7) e Homrnsiemi(, G(7)) s'identificano 
naturalmente per ogni gruppo 7: l’omomorfismo di F(,S) in 7 è definito dal- 
l’assegnazione delle immagini dei generatori liberi da S in 7, e queste immagini 
possono essere scelte arbitrariamente. 

In genere tutte le possibili strutture algebriche libere si definiscono nel mo- 
do più comodo proprio mediante il funtore aggiunto al funtore dimentican- 
te della corrispondente struttura. Le costruzioni abituali degli oggetti liberi di- 
ventano allora teoremi di esistenza. 


2.3. Dualità struttura/categoria. 


Come si è già detto nell’articolo « Applicazioni », i punti di vista strutturale e 
categoriale su oggetti matematici quali i gruppi o gli spazi topologici sono com- 
plementari. Dal punto di vista strutturale un oggetto è dato come un insieme, 
formato da elementi, con determinate leggi di composizione fra elementi, 0 pro- 
prietà di elementi, relazioni, proprietà delle relazioni, ecc. Dal punto di vi- 
sta categoriale un oggetto è considerato come elemento della classe di tutti gli 
oggetti della stessa specie, e la sua individualità è definita dalla classe di tutte le 
sue applicazioni in altri oggetti o di altri oggetti in esso, cioè dal funtore che es- 
so rappresenta. In altre parole l'approccio strutturale presenta un oggetto dal- 
l'interno, quello categoriale dall'esterno. Questa complementarità possiede vari 
aspetti più particolari, alcuni dei quali saranno ora elencati. 
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Nucleo/immagine. 


Se X è un insieme dotato di struttura, Y un altro insieme con la stessa strut- 
tura e f: X+ Y un morfismo suriettivo che conserva la struttura, allora f defi- 
nisce su X una relazione di equivalenza di tipo particolare: le sue classi di equi- 
valenza sono le f-controimmagini dei punti di Y. Questa relazione di equivalen- 
za è una nuova struttura su X, che definisce f univocamente a meno di iso- 
morfismi. Nella maggioranza dei casi si può dare una comoda descrizione strut- 
turale di tutte le relazioni di equivalenza corrispondenti a tutte le possibili f. 
Ad esempio nella categoria dei gruppi tale relazione è definita dall’assegnazione 
dell’immagine inversa dell’identità, che può essere un qualsiasi divisore normale 
ZZX, cioè un sottogruppo di X con la proprietà xZx-1=Z per ogni xeX. 
Nella categoria degli spazi vettoriali essa è definita dall’assegnazione di un arbi- 
trario sottospazio ZC X. Nella categoria degli anelli commutativi essa è definita 
dall’assegnazione di un ideale 3 CX, l’immagine inversa dello zero. Queste im- 
magini inverse si dicono nuclei di f e gli Y-fattori di X rispetto a questi nuclei 
immagini di f. In geometria algebrica gli ideali primi | di un anello A si chiama- 
no punti schematici dello spettro, e gli omomorfismi di A nei campi algebricamen- 
te chiusi punti geometrici di Spec A. Associando all’ideale p un omomorfismo 
di A nella chiusura algebrica del campo quoziente A /p, e ad un punto geo- 
metrico il suo nucleo, si ottiene una certa dualità tra i punti dei due tipi. La geo- 
metria algebrica classica considerava esclusivamente punti geometrici, in quella 
contemporanea i punti schematici hanno un ruolo importante. 

La dualità logica generale testo/significato 0, in un’accezione più particolare, 
linguaggio /interpretazione, ammette una descrizione analoga. Un linguaggio for- 
male può essere considerato come una struttura (insieme dei simboli, insieme 
delle formule, insieme degli assiomi, insieme delle deduzioni formali). La sua 
interpretazione è un morfismo di questa struttura nell’insieme, o classe, definito 
dall’assegnazione dei valori di tutti i simboli di operazione e di relazione (pre- 
dicati) nel linguaggio: il valore del simbolo di operazione è un'operazione, quello 
del simbolo di relazione è una relazione, ecc. La correlazione interna di questo 
concetto esterno di interpretazione è fornita dall’insieme delle formule del lin- 
guaggio che diventano vere nella data interpretazione. Per i linguaggi del primo 
ordine si possono descrivere tutti i sottoinsiemi di formule 7 che possono essere 
veri in un’appropriata interpretazione (modelli di 7°): questi sono i sottoinsiemi 
minimali di formule che contengano tutti gli assiomi logici e siano non-contrad- 
dittori e chiusi rispetto alle regole di deduzione. In ciò consiste il contenuto del 
teorema di completezza di Gòdel che costituisce la parte principale della dualità 
linguaggio interpretazione nell’ambito dei modelli formali di entrambi i membri 
di questa coppia. 


Categoria/struttura. 


Se la categoria C è piccola, cioè i suoi oggetti formano un insieme e non una 
classe, allora essa stessa può essere considerata una struttura, definibile me- 
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diante l'assegnazione dell’insieme ObC, degli insiemi Homg(X,Y) per ogni 
X,YeObC, e delle leggi di composizione fra questi. Un funtore F:C+C” da 
una categoria piccola in un’altra è un morfismo di queste strutture. La classe 
delle categorie piccole, con i funtori in qualità di morfismi, forma essa stessa 
una categoria; se questa classe è un insieme, essa può essere considerata a 
sua volta come una struttura, ecc. In tal modo la contrapposizione struttura /ca- 
tegoria e il suo parallelismo con la contrapposizione locale [globale (in quest’or- 
dine) non sono assoluti. Piuttosto si ha a che fare con una gerarchia di livelli di 
descrizione, al cui livello più basso si trovano le descrizioni di alcune strutture 
fondamentali come categorie (spazio topologico, insieme ordinato, ecc.). 


Oggetto /funtore. 


Il passaggio dall’esame di un insieme concreto dotato di struttura, per esem- 
pio uno spazio topologico X, all'esame di questo come oggetto della categoria 
dei gruppi cancella l’individualità degli elementi di X. Tuttavia la successiva S0- 
stituzione di X con il funtore 4y, da esso rappresentato, permette di associare ad 
X il vastissimo nuovo insieme (classe) dei « punti categoriali » di X:(JHom(Y,4X), 


con la struttura formata dalle applicazioni derivanti dai morfismi Y,> Yh, 
Se anche inizialmente X era un oggetto di una categoria astratta, dopo l’im- 
mersione canonica C-+C esso «diventa» un insieme strutturato, dopo di che 
su di esso si possono trasportare le abituali costruzioni insiemistiche, per esem- 
pio introdurre la definizione di «oggetto con una data struttura ): si veda la de- 
scrizione degli oggetti gruppali di una categoria nell’articolo « Applicazioni ». 

Inoltre, ponendo X=4y, si ha Homg(X,Y)= Homg(X,Y), cosicché la 
sostituzione di X con X riflette in modo del tutto adeguato tutte le proprietà 
categoriali di X. Ma la categoria C contiene oggetti di tipo più generale che la 
categoria C, e può essere chiusa rispetto ad operazioni fondamentali rispetto alle 
quali C non è chiusa. Per esempio, nella categoria degli schemi Sch non è pos- 
sibile fattorizzare rispetto a semplici relazioni di equivalenza, come l’azione di 
un gruppo finito. Ciò è possibile in Sch . Aggiungendo all'immagine di Sch in 
Sch° i risultati di tali operazioni, otteniamo un’importante generalizzazione 
del concetto di schema: gli «spazi algebrici» di Michael Artin. 


3. Dualità e continuità. 


3.1. Esempi classici. 


Serie ed integrali di Fourier. 


Sia f:R+C una funzione periodica a valori complessi di periodo 1: 


f(ax+1)=f(x). Il numero hf (a) earn si dice n-esimo coefficiente di 


Fourier di f. Sef(x)è la somma d’una serie assolutamente convergente — la sua se- 
co 


rie di Fourier — f(x)=) a, e?in2, allora an= f, il che giustifica il nome. Suppo- 
n=T00 
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niamo che f(x) descriva un certo processo fisico periodico o una oscillazione (x 
è il tempo). Se tale processo è lineare, allora le funzioni {e?"®*} possono descri- 
vere un sistema di oscillazioni fondamentali (armoniche). La serie di Fourier 
esprime una qualsiasi oscillazione come combinazione di oscillazioni fonda- 
mentali, e f, rappresenta l’intensità della n-esima armonica. 

Nel caso non-periodico, se all’infinito la funzione f:R-C decresce abba- 
stanza rapidamente, essa può ancora essere rappresentata come somma di ar- 
moniche, ma con una distribuzione continua di frequenze. L’intensità dell’ar- 
monica di frequenza ) è 


A I Lisi ; 
OL (serra 


e la funzione f(x) si ricostruisce a partire da f(p) per mezzo dell’integrale di 
Fourier 


16)= | Fiere. 


Per esempio, f(x) può essere la funzione d’onda di una particella nella rap- 
presentazione delle coordinate, e f()) in quella degli impulsi (cfr. $ 3.3). La lo- 
calizzazione di f(x) come pacchetto d’onda spazialmente compatto si ottiene 
i di una dispersione della regione degli impulsi p, con grandi valori di 

PD). 

Nel caso di funzioni su R” le definizioni sono analoghe, ma e*riP? è sostituito 
da e@mi@izit--+22%,), dove (i, ..., fp) è un vettore in R"**, lo spazio duale. 

Il passaggio dalla funzione f a { f,} 0 a { f(p)} si dice trasformazione di Fou- 
rier. Una funzione periodica può essere considerata una funzione sulla circonfe- 
renza unitaria, che è un gruppo topologico compatto. Allora {fn} è una fun- 
zione sull’insieme dei suoi caratteri {e?#"}, isomorfo al gruppo discreto dei 
numeri interi. Analogamente, la trasformata di Fourier di una funzione f(x) 
su R è una funzione f(f) sul gruppo dei caratteri unitari del gruppo R: 
faber}, peR. 

Storicamente la serie e l'integrale di Fourier sono stati il punto di partenza 
per molte costruzioni fondamentali: qui ci si limiterà a considerarle come mo- 
delli della teoria della dualità in una situazione topologica. 


Trasformazione di Radon. 


Sia E uno spazio euclideo, È l’insieme degli iperpiani in esso. La trasfor- 
mazione di Radon trasforma una funzione f su E in una funzione f su È: 
}(P)= Spfdup, dove up è la misura euclidea su P. La funzione f si può rico- 
struire a partire da f: f(x) è una certa media della derivata seconda di f(P) (ri- 
spetto a tutti i Pax) nella direzione perpendicolare a P, se E ha dimensione di- 
spari. Dal momento che le superfici di livello del carattere e?" 2), xe E, pe E*, 
che compare nella formula per la trasformata di Fourier di f, sono gli iperpiani 
<P; x) = cost, la trasformazione di Radon può spesso essere considerata un’ope- 
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razione più profonda. A livello di funzioni sullo spazio essa è una immediata 
generalizzazione dell’idea classica di dualità proiettiva. 


Distribuzioni di Schwartz. 


Sia D lo spazio delle funzioni complesse infinitamente differenziabili sullo 
spazio reale n-dimensionale, ciascuna delle quali è uguale a zero all’esterno di 
una sfera di raggio sufficientemente grande. Nello spazio D è assegnato un con- 
cetto di convergenza: una successione (9;) di funzioni di D) converge a zero se 
tutte le ; si annullano al di fuori di una sfera fissata e se le loro derivate di 
ogni ordine (g{f1-Zx)) tendono a zero uniformemente. 

Cosî come ogni vettore in uno spazio vettoriale a dimensione finita può es- 
sere considerato un funzionale (sullo spazio duale), le funzioni sommabili su 
R? possono essere considerate funzionali su D. A tale fine si associa alla funzione 
f l'applicazione lineare 7;:D+C secondo la formula 7;(g)= Liens) 
£(%1,.-.,%n) dx, ...,dxn. Questa applicazione è continua in g. 

In generale ogni funzionale lineare continuo T: D+C si dice distribuzione 
o funzione generalizzata. Le distribuzioni formano uno spazio vettoriale D' 
contenuto nello spazio D*, duale algebrico di D. In esso è contenuto lo spazio dei 
funzionali del tipo 7,, ma tali funzionali non esauriscono affatto D'. Un noto 
esempio di funzione generalizzata è la funzione delta di Dirac 3,, ae R”, per la 
quale 3,(f)=/f(a) per ogni fe D. Anche il funzionale «fH valore della derivata 
di f secondo una certa direzione in un dato punto » è una funzione generalizzata. 

Questa definizione si giustifica con le seguenti considerazioni fisiche. Ci si può 
rappresentare una funzione continua f su R” come densità di distribuzione di 
una certa grandezza (massa, carica, ecc.). Ciò significa che la quantità di que- 
sta grandezza nella regione UCR” è uguale a {yfdx. La funzione generalizzata 
d, rappresenta allora l’idealizzazione di una carica (0 massa) isolata concentrata 
nell’unico punto a. La densità è allora infinita in questo punto e si annulla iden- 
ticamente negli altri, cosicché essa non può essere rappresentata da una fun- 
zione sommabile. Analogamente, il funzionale « valore della derivata in un punto » 
può descrivere, ad esempio, un dipolo isolato: il limite di un sistema di due ca- 
riche di grandezza e e —e alla distanza 1/e, quando le cariche si avvicinano 
nella direzione del vettore che individua la direzione di differenziazione. 

Caratterizzare una distribuzione come funzionale continuo sullo spazio D 
delle «funzioni di prova» corrisponde ad una delle idealizzazioni del processo 
di misura macroscopica in fisica: noi non siamo mai in grado di misurare la den- 
sità di una grandezza in un punto, ma solo un suo valor medio in una regione, 
idealmente piccola ad arbitrio. Questo valor medio con «funzione peso » feD 
è il risultato di un’unica misura, mentre l’intera famiglia di medie rispetto alle 
fe, cioè il funzionale completo su D, è la massima informazione teoricamente 
possibile sulla distribuzione. Ne segue che le medie possono esistere anche se non 
esiste alcuna densità, per esempio se la distribuzione ha una struttura forte- 
mente granulare. 

Quest’idea di media ha un carattere molto generale. Essa viene usata per 
esempio nella teoria dei processi stocastici e nella teoria quantistica dei campi, 


Dualità 162 


dove gli osservabili locali dei campi sono solo operatori generalizzati. Non è 
possibile qui soffermarsi più a lungo su questo punto. 


Commento. Si è mostrato brevemente che le pit semplici idee algebriche 
di dualità (gruppi abeliani e spazi vettoriali) conducono, nell’ambito dell’ana- 
lisi, ai modelli matematici di importanti complementarità quali onda/particella, 
discreto/continuo, locale/globale, ecc. 

Il ruolo di queste fondamentali idee algebriche non deve essere messo in 
ombra dal fatto che in tutte le costruzioni concrete dell’analisi i problemi della 
scelta dello spazio adatto, della sua topologia, la dimostrazione delle stime neces- 
sarle, ecc., occupano uno spazio incomparabilmente più ampio della semplice 
algebra. Nel seguito si esporranno un piccolo numero di esempi caratteristici, 
tratti da alcuni importanti capitoli dell'analisi funzionale, che utilizzano in vari 
modi l’idea di dualità. 


3.2. Dualità lineare. 
Spazi vettoriali topologici. 


Modi generali per assegnare una topologia. 


Nell'articolo « Applicazioni » si è spiegato che dare una topologia su un insie- 

me 4 significa assegnare una famiglia di sottoinsiemi di questo, detti aperti. 
Tale famiglia deve contenere @ e X, ed essere chiusa rispetto a intersezioni 
finite e unioni arbitrarie. Un insieme dotato di una topologia si chiama spazio 
topologico. 
__ corre ancora introdurre alcune definizioni di uso generale, necessarie per 
il seguito. I complementari degli insiemi aperti si dicono chiusi. Il più piccolo 
insieme chiuso contenente il sottoinsieme YCX si dice chiusura di Y. Un in- 
sieme Y contenente xe X e un aperto U3x si dice intorno di x. 

Sia B una sottofamiglia di insiemi aperti di X con la seguente proprietà: 
per ogni intorno Y di un qualsiasi punto xe X si può trovare un Ue B tale che 
Y2U3x. Una tale famiglia B si dice sistema fondamentale di intorni, o base 
della topologia di X. L’intera topologia di X si ricostruisce univocamente a par- 
tire da una sua qualsiasi base. Per esempio, se X, Y sono spazi topologici, si può 
definire univocamente la topologia prodotto su Xx Y, nella quale serviranno 
da base i prodotti U x V, dove UCX, VS Y sono insiemi aperti arbitrari. 

l Un'applicazione tra spazi topologici f: X+ Y si dice continua se la f-contro- 
immagine di un qualsiasi insieme aperto di Y è un aperto di X. 

l Uno spazio topologico Y si dice compatto se da ogni suo ricoprimento con 
insiemi aperti sì può estrarre un sottoricoprimento finito, e discreto se ogni 
suo sottoinsieme è aperto (e perciò anche chiuso). 


Spazi vettoriali topologici. 


Sia K uno dei campi R o C. Si dice spazio vettoriale topologico (svt) su K 
uno spazio vettoriale L su X, su cui sia data una topologia tale che le applicazioni 
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LxL+L:<,l>)Hh+L, e KxL+L:<Ka,l)Hal siano continue. Si possono 
considerare come esempio gli spazi a dimensione finita XK? con la topologia 
prodotto: questa è l’unica topologia che rende K® uno svT. Nel seguito di questo 
capitolo c’interesseremo principalmente agli svr a dimensione infinita. 

I casi K=Re € sono gli unici considerati nell’analisi funzionale classica. Ne- 
gli ultimi decenni hanno richiamato un'attenzione sempre crescente gli svr su 
campi topologici quali i numeri p-adici Q, 0 il completamento C,, di una chiu- 
sura di Q,. La costruzione dell’analisi funzionale su C,,, che tenga conto dell’a- 
zione del gruppo di base, probabilmente avrà applicazioni essenziali in teoria dei 
numeri. 

Gli svt concreti a infinite dimensioni si costruiscono spesso per stadi. Sia X 
un insieme. Il più semplice spazio ad esso collegato è lo spazio di tutte le fun- 
zioni su X a valori in R 0 C; esso è a dimensione infinita se X è infinito. In genere 
esso è eccessivamente grande, e se ne estrae un sottospazio di funzioni soddisfa- 
centi condizioni supplementari. Quando X è uno spazio topologico, si possono 
considerare le funzioni continue; quando X è una varietà differenziabile, quelle 
differenziabili, ecc. Altri tipi di limitazione saranno considerati in seguito. La 
non-univocità della scelta degli spazi funzionali associati a un dato X, e della to- 
pologia su di essi, è il motivo principale delle complicazioni rispetto al caso a 
dimensione finita. 

La topologia su un dato spazio di funzioni spesso si assegna in base alla ri- 
chiesta che alcuni funzionali, interessanti su questo spazio, siano continui. Per 
esempio, una successione di curve lisce y=f,(x) su [0,1] converge a y=f(x) 
se sup|f(x)—f(x)|>0 per n- co. Ma il funzionale «lunghezza della curva » 
in questa topologia non è continuo: ad esempio f,(x)=(1/n)sinnx tende a 
f=0, mentre la lunghezza della curva f, non tende a 1. Per rendere continuo 
questo funzionale occorre rafforzare la topologia richiedendo, ad esempio, la 
convergenza uniforme non solo delle funzioni, ma anche delle loro derivate. 

In altri casi può risultare utile indebolire la topologia, richiedendo solo la 
convergenza «in media », ad esempio (3|f(x)—f,(x)|? de-+o: qui sono ammesse 
deviazioni locali arbitrariamente grandi di f,, da f, purché siano concentrate su 
insiemi di misura piccola. Le «norme » e le «seminorme » mediante le quali si 
assegnano le topologie sugli svr generali (cfr. oltre) sono in genere scelte in 
modo tale da garantire la continuità dei funzionali per noi importanti. 

Può accadere che uno svT, ad esempio uno spazio di funzioni, dopo essere 
stato costruito risulti non-completo, come non è completo lo spazio dei numeri 
razionali nella topologia archimedea; allora occorre completarlo. Si dànno delle 
definizioni precise che è comodo formulare in termini di reti convergenti, le 
quali generalizzano le successioni convergenti dell’analisi classica. 

Sia A un insieme diretto (o filtrante a destra), cioè un insieme su cui sia 
data una relazione d’ordine x>} soddisfacente l'ulteriore condizione: per ogni 
a, Be A esiste ye A tale che y>a e y>. Ogni applicazione di A in X si dice una 
(A-)rete su _X. È comodo indicare una A-rete con {x,|]a€ A, x,€X}, o sempli- 
cemente {x,,}. Se X è uno spazio topologico, {x,} una rete su X, xe X, scriveremo 
x,-% 0 lim x,=%, se per ogni intorno U3x esiste un «€ A tale che per ogni 
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Be A4,B>a, risulti xge U. In questo caso si dice che la rete x, converge al punto x. 
In uno spazio di Hausdorff una rete può convergere a un solo punto. L’assegna- 
zione di una topologia in X può, a volte, essere sostituita dalla descrizione di 
tutte le reti, convergenti ai punti di X, poiché un'applicazione f: X+ Y è con- 
tinua se e solo se da x,+x segue che f(x,)>f(x) per ogni rete su X. 

Una rete {x,} in uno svr L si dice fondamentale se per ogni intorno dello 
zero USL esiste un a tale che da 8>x e y>a segue x3—x,€ U. Uno spazio L 
si dice completo se ogni rete fondamentale ha un limite in esso. La costruzione 
classica di R a partire da Q si trasporta agli svr e permette, per ogni svT L, 


di costruire il suo completamento LZ insieme con un’applicazione continua 
L4+L. 

Infine, dagli svT iniziali, del tipo spazi di funzioni, si possono formare nuovi 
SVT, come gli spazi dei funzionali lineari continui su essi, dei prodotti tensoriali, 
ecc. Gli effetti della non-unicità della topologia continuano ad agire anche in que- 
sti casi; si tornerà in seguito su queste costruzioni. 


Norme e seminorme, 


Si dice seminorma p su uno spazio vettoriale L su K=R o C, l’applicazione 
d: L+R che soddisfa le condizioni: 1) p(x)=0; 2) p(x+y)<P(x)+9(7); 
3) pb(Ax)=|\|p(x) per ogni x,ye L, Xe K. La seminorma p si dice norma se, 
inoltre, da p(x)=o segue che x=o. Se p è una norma, invece di p (x) spesso si 
scrive |x|. 

Ogni famiglia di seminorme ($;) su L definisce una struttura di svT nella 
quale una rete x, € L converge a xe L se e solo se p;(x,—x)-+0 per ogni 7. Se la 
topologia su L può essere assegnata da una famiglia consistente di una sola nor- 
ma, L si dice normato. 

Uno svr normato completo si dice spazio di Banach. 

Uno spazio di Banach la cui norma |} soddisfa l’identità |x+y|?+ 
+|x—y]?=2lx]|?+2]||y||? si chiama spazio di Hilbert. 


Esempio. Sia X uno spazio vettoriale, C(X) lo spazio delle funzioni con- 
tinue su X. Si prenda in considerazione il caso X= [0,1] e per ogni p>o si 
ponga per fe C[0,1] 

If lo=[S61f®)]? daje 
If |-=sup]f|. 


Si può dimostrare che per ogni p=I 0 f= 0, || ||, è una norma. Sia t, la to- 
pologia definita dalla norma | {|,, L,[0,1] il completamento di C[o,1] in que- 
sta topologia. La norma || |, si prolunga su L,[0,1] e lo rende uno spazio di 
Banach. Se p=00 esso coincide con C[o,1]; se p<c0 non coincide. Se p=2, 
L,[0,1] è uno spazio di Hilbert. 

Esempio. Sia QCR" un aperto, C*(0) lo spazio delle funzioni infinita- 
mente differenziabili su Q. La topologia abituale su C°(Q) è definita dalla 
convergenza uniforme, con tutte le derivate, su ogni compatto in Q. Rappresen- 
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Le . 
tando 0 come unione | K,, di sottoinsiemi chiusi e limitati (e perciò compatti), 
m=1 . . . . 
si può assegnare questa topologia mediante il sistema di seminorme 


Pn) =sup È |9(2)]. 


ceKm |9|=0 
dl 


Qui x= (11. xa), 1= (1 > a), lal=& + +40 09) = aan) 

Lo spazio delle funzioni fondamentali D(0)  C*(L2) per definizione è for- 
mato dalle funzioni a supporto compatto: ognuna di esse si annulla all’esterno 
di un opportuno sottoinsieme chiuso e limitato di Q. Il più piccolo sottoinsieme 
chiuso all’esterno del quale la funzione u sia uguale a zero si dice supporto 
di u, e si indica con supp. 

Se KCQ è chiuso e limitato, lo spazio Dx delle funzioni ue C®(0) con 
suppuCK è dotato di una topologia per mezzo del sistema di seminorme 


Mm 
dr,m(u)= sup Y |u9(x)|. 
xeK |gq|=0 
Se Kc Kg, si ha Dx, CD, € le topologie su Dx, e Dr, sono compatibili. Nello 
spazio D(Q2)= |) Dy si introduce la topologia più debole che induca su ogni 
K 


Dx la topologia deci sopra. Lo spazio ottenuto si dice spazio delle funzioni 
fondamentali su Q. Le funzioni generalizzate su © saranno in seguito definite 
come funzionali lineari continui su D(LQ). 

È necessario osservare che D(L2) è solo uno tra i possibili spazi di funzioni 
fondamentali rispetto ai quali, per dualità, si definiscono spazi utili di fun- 
zioni generalizzate. Un’altra classe di spazi è descritta nel seguente esempio: 

Esempio. Lo spazio Sf(x=o, f=>0) per definizione è formato da quelle 
funzioni infinitamente differenziabili 9 (x) su R per cui esistono delle costanti 
A, B, C (dipendenti da 9) per cui: |xfp (x){<CA*B%kg9? per ogni k, 9g. 

La topologia su Sf s’introduce nel modo seguente. Sia SEE lo spazio 
{ep (x) | |xFpl9(x)| < CA*B?k4%99} per arbitrari k,g, A> A e B>B. S'introduca 
una topologia su SE: mediante il sistema di norme 

1 


1 k 1 = 
lol. n= s0pr atte |(4+7) (24) 


Esso è completo in questa topologia. Su S£= |) S&# si introduce la topologia 


dell’unione, nella quale una successione di funzioni converge a zero se essa 
è tutta contenuta in uno degli spazi Sf:4 e converge a zero in questo spazio. 

Le costanti x e } impongono delle restrizioni sul modo in cui la funzione 
e le sue derivate decrescono all’infinito. Se queste restrizioni sono troppo forti, 
può accadere che lo spazio S£ si riduca al solo zero. Un risultato non-banale 
è che S£# {0} solo per x+=1, «>0, B>0, e anche per B>I, ax=0 e a>1, 
B=o. La trasformata di Fourier trasforma SÈ in Sf, essenzialmente perché 
scambia di posto gli operatori di moltiplicazione per x e quelli di derivazione 
rispetto a x. 
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Topologia e convessità. 


Sia L uno spazio vettoriale su R o su C, e x,ye L. L'intervallo di estremi x, y 
in L è il sottoinsieme {ax+(1—a)y}, o<a<1. Un sottoinsieme UCL si 
dice convesso se contiene, insieme con due qualsiasi punti x,ye U, anche l’in- 
tero intervallo di estremi x, y. Un sottoinsieme UCL si dice equilibrato se 
da xe U, e |A|<1 segue che Axe U. Un sottoinsieme UCL si dice assorbente 
se per ogni xe L esiste A>o con Axe U. 

La connessione tra questi concetti e i precedenti è la seguente: se nello 
SVT L la topologia è data mediante una famiglia di seminorme (p;), allora si ha 


un sistema fondamentale di intorni dello zero in L: Ta) {x |p;x(®)<8}, che risul- 
K=1 


tano insiemi convessi, equilibrati ed assorbenti. È vero anche il viceversa: se 
lo svr L è localmente convesso, cioè ammette una serie di intorni dello zero for- 
mata da insiemi convessi, allora la sua topologia può essere assegnata mediante 
un sistema di seminorme. 

La classe degli spazi localmente convessi (sLc) L sarà fondamentale nelle no- 
stre considerazioni. Il suo ruolo nella teoria della dualità si spiega già per il fatto 
che per ogni sLc L ed ogni punto xe L esiste un funzionale lineare continuo 
f:L4+R tale che f(x)x0. 


Spazio topologico duale. 
Definizione di L'. 
Sia L uno svr su un campo K. Lo spazio topologico L’, duale di L, è formato 


da tutti i funzionali lineari continui L+K. Esso è un sottospazio dello spazio 
duale algebrico L*, nella cui definizione non si tien conto della topologia di L. 

Topologie in L'. 

In L'è naturale considerare almeno due diverse topologie: la debole e la forte. 
Nella topologia debole una rete {f,} in L' converge ad f se e solo se per ogni 
xeL si ha fa(x) f(x) (convergenza puntuale). Nella topologia forte la conver- 
genza è la convergenza uniforme sugli insiemi limitati di L. (Un sottoinsieme 
FCL si dice limitato se per ogni intorno U dello zero esiste AeR tale che 
FC)U; negli spazi localmente convessi ciò è equivalente alla limitatezza di 
f(#) per ogni fe L'). 

Se L è uno spazio di Banach con norma p, su L' si ha una struttura naturale 


di spazio di Banach con norma p', per la quale p'(f)= sup | f(x)|. La topologia 
corrispondente a p' coincide con la topologia forte. ?@®s1 


Esempio: distribuzioni. Si dice distribuzione ogni elemento dello 
spazio D(0), dove lo spazio delle funzioni fondamentali D(Q) è stato definito 
nell'esempio di p. 164. In altre parole, una distribuzione 7° è un’applicazione 
lineare 7°: D(0)+R (0 C) tale che per ogni compatto KCQ esistono C>o e 
no tali che per ogni ueD(0) si ha |T(2)] <C sup » zx). 

xeK | 


gl=0 
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Ad esempio, se la funzione fin Q) è sommabile in ogni compatto, allora ad es- 
sa corrisponde la distribuzione T;: u+ fou(x)f(x)dx. Tali T; si dicono regola- 
ri. L'applicazione fr» 7}, limitata su D(0), definisce un'immersione canonica 
D(Q)+9(0),, cosicché lo spazio D(L)' si comporta come un ampliamento dello 
spazio di funzioni D(L), il che spiega l'origine del termine russo ‘funzione gene- 
ralizzata’. Si userà questo termine come sinonimo di «distribuzione ». 

La convergenza delle distribuzioni è la convergenza nella topologia debole: 
T,-+T se per ogni uveD(0), T,(u)> T(u). 

Per le distribuzioni regolari 7 con fe DL) è verificata l’identità 7},,,,,(0) = 
=-T;(du/dx;) (integrazione per parti). È naturale esprimere il funzionale a 


ò 
sinistra dell’uguaglianza nella forma 2 T;, e quello a destra con ATA Si 


v 
osservi che quest’ultimo funzionale è definito per tuttii TeD(02)". Ciò conduce 
alla definizione dell’operatore di derivazione parziale sulle funzioni generalizzate: 


dld È ( si dI T FE SA du 
LO MO) +90): a (u)=(—1)! r(53) 


Tutti questi operatori sono continui nella topologia di D(LQ); i risultati del- 
l'applicazione di questi a 7, per una funzione f sommabile, ma non necessaria- 
mente differenziabile, sono detti derivate generalizzate di f. Questo è uno degli 
effetti della dualizzazione: la derivazione diventa possibile per una classe molto 
più ampia di funzioni, a prezzo del fatto che il risultato della derivazione è un 
oggetto di natura differente. 

Per mezzo delle derivate generalizzate si può descrivere completamente la 
classe delle funzioni generalizzate finite 7, che si definisce nel modo seguente. 
Si dice supporto di 7, supp 7, il più piccolo insieme chiuso in Q tale che, per 
ueD(0) con supporto al di fuori di esso, sia T(u)=o. Una funzione genera- 
lizzata 7 è finita se il suo supporto è compatto in O. Ogni funzione generaliz- 
zata finita può essere rappresentata come somma finita di derivate generalizzate 
di funzioni continue con supporto compatto in O. Per esempio, per Q=R, la 
funzione delta è,, in un intorno dell’origine, coincide con la derivata seconda del- 
la funzione che è uguale a zero per x<o, e uguale a x su un qualsiasi inter- 
vallo [0,6], e>o. 

Esempio. Lo spazio L,[0,1], nella topologia forte, è naturalmente iso- 
morfo a L,[0,1], dove g è definito dalla condizione (1/9)+ (1/9) = 1. La forma bi- 
lineare < f,.g> > [3 fg dx, dove feL,, geLy definisce contemporaneamente f co- 
me funzionale lineare continuo su L,, e g su Ly; essa definisce anche la corri- 
spondente dualità. Inoltre la norma di Banach del funzionale g+ (1 fe dx coin- 
cide con la norma || f ||, della funzione f in L,,. 

In particolare lo spazio di Hilbert L,[0,1] è isometrico al suo duale: su R 
l’isometria è realizzata dall’applicazione f+ funzionale (g+ [3 fg dx) (su C oc- 
corre prendere {1 ff dx). Più in generale, se L è un qualsiasi spazio di Hilbert 
su C con norma | ||, su di esso si ha una forma R-bilineare canonica: il prodotto 
scalare (x,y)= (1/4)[lx+y|?—]|x—y|P-+i]x—y|?—i]x+y|P]. Rispetto ad x 
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essa è lineare anche su C, e rispetto ad y è antilineare su C: (x, ay)= d(x, 9). 
Inoltre essa è continua e non-degenere in entrambi gli argomenti: invero 
(x, x)= |x||?. Perciò essa definisce un’applicazione canonica L>+L':xH{yH 
+(y, x)}, che è un isomorfismo (antilineare in C). 


Nel seguito occorreranno concetti fondamentali della teoria della misura. 

Misura e integrale. Sia X un insieme. Si dice c-algebra B su X una fami- 
glia di sottoinsiemi di X, chiusa rispetto ad unioni numerabili, intersezioni nu- 
merabili e complementi. La più piccola o-algebra, contenente tutti gli insiemi 
aperti di uno spazio topologico X, si chiama c-algebra di Borel. 

Si dice misura p sulla c-algebra degli insiemi u-misurabili B (0, per brevità, 
su X) un'applicazione u:B+R (o C) tale che da E,NE,=@ segue che 
u(ZUVE)=u(E,)+u(E,). La misura y si dice numerabilmente additiva se 


da ENE;=@ per i#j segue che #(UE)=Y u(E;), dove la serie a destra 
1 1 


converge assolutamente. La misura u è positiva se u(E)=o per ogni Ee B. Si 
dice variazione della misura numerabilmente additiva p la misura |u|(£)= 


=sup ) |u(E;)l, dove il sup è preso su tutte le partizioni E= Vee Exe B, 


E;NE;= 2 per #j. La misura y è detta completa se da E, E,eB, E\cEcE,, 
Ie(ENE)= o segue che E e B. Ogni misura numerabilmente additiva si estende 
a una misura completa (mediante un opportuno ampliamento dell’algebra B). 

La consueta misura su R (che, sugli intervalli, coincide con la lunghezza), 


ca 
non soddisfa alla condizione che la serie >» u(E;) converga (necessariamente) 
1 


per E;NE;= ©. Ma R può essere rappresentato come unione di una famiglia 
numerabile di semiintervalli disgiunti, su ciascuno dei quali la consueta misura 


di Borel soddisfa le nostre definizioni. Nel caso generale, se X =\UX; (unione 
10 
disgiunta), e su ogni X; è data una misura y,;, allora la misura p= L p: Si dice 


o-finita. Essa è definita per quegli EC X per i quali ENX; è pmisurabile, e la 
serie p Uu(EN0X,) converge assolutamente. 


Una funzione f: X+R (o C) si dice u-misurabile se la f-controimmagine di 
un qualsiasi insieme aperto è misurabile. Una funzione misurabile si dice sem- 
plice se assume un insieme al più numerabile di valori distinti { fx}. Se la somma 
p Ffrw(*|f(*)=fg) converge assolutamente, essa si chiama integrale della fun- 


zione semplice f rispetto alla misura y, e si indica con fr f(x)du(x) o {fdu. 
Una funzione misurabile f=0 si dice u-integrabile se esiste C'>o tale che per 
tutte le funzioni semplici g<fsi ha | fxg du|<C. In questo caso si dice integrale 
Jfdu l'estremo superiore degli integrali {yg du rispetto a tutte le funzioni sem- 
plici g<f. 

Una funzione misurabile complessa f si dice p-integrabile o sommabile se 
|f| è |u|-integrabile. L’integrale {y fdu è univocamente definito su tali fun- 
zioni dalle condizioni di linearità rispetto ad f e yu. 
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Con questi dati è possibile continuare la descrizione degli spazi topologici 
duali. 


Esempio: le misure come funzionali continui. Sia X uno spa- 
zio di Hausdorff localmente compatto, K(X) lo spazio delle funzioni continue 
su X a supporto compatto. La topologia su K(X) è data dalla definizione di 
convergenza: f,+f se esiste un compatto KCX tale che K2suppfy supp f e 
fs, converge uniformemente ad f. 

D'altra parte si consideri lo spazio delle misure regolari su X, cioè delle mi- 
sure che godono della proprietà: per ogni insieme misurabile E con u(E)< 0 e 
ogni e>o esistono un compatto K e un insieme aperto U tali che KCECU 
e lp|(UNK)<e. 

Ogni misura regolare u definisce su K(X) un funzionale lineare continuo 
Sf [xfdu, e tutti gli elementi dello spazio duale K(X)' si ottengono in tale modo. 

Nello spazio delle distribuzioni D(LA)' si trovano i funzionali T,: + fo(x) 
du.(x), corrispondenti alle misure c-finite p, su Q. La funzione delta di Dirac, 
S,(a6 0), per esempio, corrisponde alla misura unitaria concentrata nel punto a: 
u(E)=1 se ae E, u(E)=o altrimenti. 

Esempio: gli spazi Ly(X,u). Se X è uno spazio con misura p, è 
possibile definire L,(X,u), per > 1, come il completamento dello spazio delle 
funzioni su X con norma finita || f = fel F(x)|?d}u](®)]!?. Tutti i risultati 
formulati sopra per gli spazi L,[0,1] restano veri in questo contesto più generale. 
In particolare L,(X,pu)' è isomorfo aL,(X,yu), dove (1/p)+(1/9)=1. 

Riflessività. 

Se L è uno spazio lineare normato, allora L' è uno spazio di Banach, e si può 
costruire lo spazio L”’, biduale di L. Si ha, come nel caso a dimensione finita, 
un ‘applicazione lineare canonica B:L>L'": B(a) è è fl (x) come funzione di fe L'. 
Si può dimostrare che l’applicazione è una isometria di L con B(L), e B(L) 
è denso in L'' nella topologia debole, ma non coincide necessariamente con L'. 

Lo spazio L si dice riflessivo se 8 è una isometria di L con L”. Da quanto os- 
servato a p. 167 si deduce che gli spazi di Hilbert sono riflessivi. Analogamente 
sono riflessivi glispazi L,(A)perp>1. 

Uno dei criteri di riflessività di L consiste nella condizione che ogni fun- 
zionale fe L' raggiunga il suo estremo superiore sulla sfera unitaria ||x|=1 in L. 
Un'altra condizione è la compattezza della sfera unitaria ||x|<1 nella cosiddetta 
topologia debole in L. In questa topologia una base di intorni dello zero è for- 
mata da tutti i possibili insiemi del tipo {xeL]{fi(x)l,....|fn(x)|<£}, dove 
e>o € fi, «fn L' sono funzionali arbitrari. 


Operatori lineari, prodotti tensoriali e nuclearità. Se L,, L, sono spazi vet- 
toriali a dimensione finita, si ha l’isomorfismo canonico Hom(L,, L)=L*@L. 
In esso sono unificate due idee di dualità: dualità degli spazi vettoriali e dualità 
secondo Kan dei due funtori Hom e ® (cfr. $$ 1.2 e 2.2). Il trasporto di que- 
sta identità al caso di infinite dimensioni non è banale, dato che la definizione 
dell’analogo topologico del prodotto tensoriale non è univoca, e l'applicazione 
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di questo nello spazio degli operatori cessa di essere un isomorfismo. Lo studio 
degli oggetti che si presentano naturalmente in questo contesto conduce all’in- 
dividuazione dell’importante classe degli operatori e degli spazi nucleari. 

Nel seguito si considereranno successivamente le varianti topologiche degli 
spazi Hom(L,, Ls), L*@®L, e le connessioni tra loro. 

Spazio degli operatori. 

Siano L,, Ly due svr. In questo caso, invece di Hom(L,, Ly), si considerano 
le applicazioni lineari continue L,+L, (operatori lineari da L, in Ly). Gli ope- 
ratori lineari formano uno spazio vettoriale, che si indica con £(L,, L.). 


Se L, ed L, sono normati, anche in £(L,, L,) si può definire una norma: 
[A4j=sup|A(x)||. Nel caso generale, su £(L,, Ly) si hanno alcune topologie na- 
n= 


turali, sulla cui definizione non ci si soffermerà. 
Lo spazio topologico duale L’ è, evidentemente, £(L, K). 


Operatore aggiunto. 
Sia Ae£(L,, Ly). L'operatore A*:L#*+L*, aggiunto algebrico di 4, può 
essere ristretto al sottospazio topologico dual Li , CL*. Si ottiene un operatore 


A':Li+LI che si dice aggiunto topologico di A 
Prodotti tensoriali di spazi hilbertiani e normati. 


Siano (Ly, p1), (Ly, Ps) spazi normati. Se questi sono hilbertiani, sul pro- 
dotto tensoriale algebrico L,@L, è definita un’unica norma hilbertiana che sod- 
disfa la condizione p(x1®x:)=;(x1)f:(xs) per ogni xye L,, xe Lo. Rispetto 
a questa norma lo spazio L,®L, è separato, ma non completo. Il suo comple- 
tamento (L,®L,) si dice prodotto tensoriale hilbertiano degli spazi L, e Lo. 

Nel caso generale la condizione p(x,®xs)=1(x1)fs(x3) non definisce uni- 
vocamente una norma su L,@L,. Tutte le norme con questa proprietà si chia- 
mano norme tensoriali. Tra queste ne esiste una massima, pj ©», e una minima 
P1®pz Cioè p,®p,=inf ) p1(x;)p2(Y:;), dove inf è preso rispetto a tutte le rap- 


presentazioni di 2 nella forma 2 =) x;®y;; analogamente (p,1®2) = sup|f(x)|, 
dove sup è preso su tutte le f=f®fo, feti, fee Lb, di(f)< <1.1l corrisponden- 
ti completamenti si indicano con L,@Ly e L 1® Ls. Si ha un'immersione naturale 
L.®L,cL1®Ly. 


Connessione tra prodotti tensoriali ed operatori. 


Sia definita l'applicazione canonica L{®@L,-£(L,, Ls) che all'elemento 
f@x (feLi, xe Ls) associa l'operatore di rango 1, y++f(y)x (si dice rango ‘di 
un operatore lineare la dimensione della sua immagine). L'immagine di L{®L, 
consiste di tutti gli operatori di rango finito. L'applicazione canonica descritta 
si estende ad un’applicazione L{®L,+£(L,, L,) che, in generale, non è né iniet- 
tiva né suriettiva. La sua immagine coincide con la chiusura in norma dello 
spazio degli operatori di rango finito. Tutti gli operatori di questo tipo sono 
completamente continui, cioè trasformano insiemi limitati in insiemi con chiu- 
sura compatta. 
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L’immagine del prodotto tensoriale hilbertiano (L'®@ L)7 in £(L, L) consiste 
dei cosiddetti operatori di Hilbert-Schmidt. 

Nell’immersione naturale LIO L, CL{®@L, gli elementi di L{Ò L, sono tra- 
sformati in elementi dello “spazio di operatori £(L,, L,), che si dicono nucleari. 


Essi hanno la forma xY (n (0) dove f, e Li, ape L, € x IAA laenll< 0. 


Se L è uno spazio di Hilbert, si ha il seguente criterio di dana di un ope- 
ratore A:L+L. Sia (x) una base ortonormale di L, cioè tale che ||x,|=1 e 
(X,9%9)= =0 per ogni x#f e (y,x.)=0 per ogni x dalia che y=o. La nuclea- 
rità di A equivale alla convergenza della serie 2A (Ax,, xp) per ogni base ortonor- 


male. La somma di questa serie non dipende dalla scelta della base, e si dice 
traccia dell’operatore A. 


Spazi nucleari. 


Si supponga ora che la topologia su L, sia data dal sistema di seminorme 
{pa}, € in L, dal sistema di seminorme {gg}. Le seminorme p,®gg e fa Ddg 
in L,@Lg; sono definite esattamente dalle stesse relazioni di prima. I completa- 
menti di L\@L, rispetto ai sistemi di seminorme { dadgg} e { Pa® de} saranno 
indicati rispettivamente con L 19 L3 e L,\® Lo. Come sopra, si ha un'immersione 
naturale L1®L,cL, @Lo. 

Uno sLc L si dice nucleare se per ogni sLc M risulta LèM=L®@M. 

Tra gli spazi normati solo quelli a dimensione finita sono nucleari. Se sullo 
sLc L è definito un sistema numerabile di seminorme (x), allora la condizione 
di nuclearità per L è la seguente: per ogni & esiste un j>A tale che l’applicazione 
di identificazione (L, p;)-(L, fx) sia nucleare. 

Gli spazi nucleari posseggono una serie di buone proprietà topologiche. In 
essi la topologia debole e la forte coincidono, gli insiemi chiusi e limitati sono 
compatti, come nel caso a dimensione finita. La categoria degli spazi nucleari 
è chiusa rispetto ai limiti proiettivi ed induttivi, e al passaggio a sottospazi chiu- 
si e a spazi quoziente rispetto a questi. Infine, ogni operatore lineare continuo 
da uno spazio nucleare o in uno spazio nucleare è nucleare. Più precisamente, 
l'applicazione canonica LIO L= L{®L,+£(L,, L) è un isomorfismo, cosicché 
si ottiene un’analogia completa con il caso a dimensione finita. L'importanza 
del concetto di nuclearità non è determinata solo da. queste proprietà. L’indi- 
viduazione di questo concetto ha rappresentato il compimento di un certo sta- 
dio della geometrizzazione dell’analisi funzionale lineare. 

L'introduzione dei concetti di spazio di Hilbert inizialmente, e poi di spazio 
di Banach, sono state le prime pietre miliari di questo stadio. Ma il contesto de- 
gli spazi di Banach è risultato ristretto per esempi importanti e naturali quali gli 
spazi delle funzioni fondamentali e delle distribuzioni. L’assiomatizzazione delle 
loro proprietà topologiche ha condotto alla definizione degli spazi localmente 
convessi, ma questa categoria è risultata troppo ampia per tutta una serie di 
scopi. Ora si ritiene che gli spazi nucleari, di cui fanno parte tutti gli spazi im- 
portanti di funzioni fondamentali e generalizzate, costituiscano la classe più na- 


8 
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turale rispetto a tutta una serie di proprietà. La complessità della loro definizione 
è bilanciata dalla semplicità dell’«algebra multilineare » in questa classe. Un ul- 
teriore esempio delle buone proprietà degli spazi nucleari è l’esistenza di una 
«analisi di Fourier » su di essi, Ogni rappresentazione unitaria di R” può essere 
rappresentata come integrale di Fourier rispetto ad una certa misura sullo spazio 
duale R**, Se, invece di R”, si considera uno sLc, questo risultato rimane vero 
se e solo se tale spazio è nucleare. 


3-3. Algebre di Banach e loro spettri. 


La geometria si occupa degli spazi, l’analisi delle funzioni su di essi. La 
relazione spazio/funzioni ha le caratteristiche della dualità già per il fatto che 
«inverte le frecce »: un’applicazione di spazi corrisponde al trasporto delle fun- 
zioni nella direzione opposta (cfr. $ 2). Punto di partenza possono essere tanto 
gli spazi quanto le funzioni, eventualmente in senso generalizzato. La teoria 
degli schemi in geometria algebrica ha origine dalla formulazione precisa del- 
l’idea che ogni anello commutativo è un anello di funzioni su un appropriato og- 
getto geometrico: il suo spettro. Questa costruzione è stata preceduta dalla fon- 
dazione della teoria delle algebre di Banach e dei loro spettri nel contesto dell’a- 
nalisi. Nella sua accezione generale lo spettro di un anello è quello spazio na- 
turale sul quale gli elementi dell'anello siano funzioni. Si dànno qui di seguito 
alcune definizioni precise. 


Algebre di Banach. 


Un’algebra, dotata di unità sul campo dei numeri complessi, si dice di Ba- 
nach se è dotata di una struttura di spazio di Banach, con norma | ||, per la 
quale leyll<HxIl {o}, [x||=1, e la moltiplicazione è continua. 

Nel seguito ci si limiterà a considerare algebre di Banach commutative. 


Caratteri e spettro. 


Sia 4 un’algebra di Banach commutativa. Si dice carattere di 4 un omo- 
morfismo continuo non nullo y : A+C. Si dice ideale massimale in A un ideale 
ic A tale che tra i ed A non vi siano ideali intermedi. A partire da ciascun ca- 
rattere y si può costruire un ideale massimale i, il nucleo di y; a partire da 
ogni ideale massimale, un carattere y: A+A/i=C. Si dice spettro M(A) del- 
l’algebra A l'insieme dei suoi ideali massimali, o l’insieme dei suoi caratteri: per 
quanto detto sopra essi sono in corrispondenza biunivoca. 


Esempio. L’anello delle funzioni continue C(X) su un compatto X con 
If] = 1f(x)| è un’algebra di Banach. Ogni punto xe X definisce a) il carat- 


tere Xe: Sua 5) l'ideale massimale iy={f]|f(x)=0}. In tal modo si ha 
un ‘applicazione X>M (C (X ). Si può dimostrare che essa è bilettiva, cioè che 
X si ricostruisce come insieme a partire dal suo spettro M (C(X)). In effetti si 
può ricostruire anche la topologia. 
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Topologia sullo spettro. 


Ogni carattere di A è un elemento dello spazio di Banach A4', duale topologico 
di 4: si ha perciò un’immersione naturale M(A)C A°. Si doti M(A) della topo- 
logia indotta dalla topologia debole su A‘. Si può dimostrare che M(A) è chiuso 
e limitato e perciò compatto. Nell’esempio precedente l’applicazione canonica 
X+M(C(X)) è un omeomorfismo. 


Esempio. A4={x= (x, &,, ...){llx] =} |x;j{< 0} con la moltiplicazione 
(xy)n =) x,Yn-x- Lo spettro M(A) è isomorfo al cerchio unitario complesso 


=) 00 
{|x|<1|zeC}. Il punto 2 corrisponde al carattere x) x;2°. 
#0 
Relazioni di dualità. 


L'applicazione M (spettro) è un funtore dalla categoria delle algebre di Ba- 
nach nella categoria duale della categoria degli spazi topologici compatti. È na- 
turale considerare lo spazio M(A) come oggetto duale dell’algebra A. 

Perogni Asiha un'applicazione naturale di algebre di Banach A+ > C(M(A)): 
x» £, dove «X)= x(x) per ogni «e A, ye M(A). Il secondo esempio mostra 
che esso non è necessariamente un isomorfismo: in esso l’immagine di A è for- 
mata dalle funzioni analitiche nel cerchio, ma non da tutte le funzioni analitiche. 
Una dualità precisa si ottiene soltanto per le algebre C(X) con X compatto. 


3.4. Gruppi topologici e trasformata di Fourier. 


La teoria della dualità per i gruppi topologici ha una forma compiuta solo 
nel caso commutativo. Per gruppi non-commutativi un’appropriata definizione 
di oggetto duale non è stata trovata, a quanto pare, neppure nel caso finito. Qui 
ci si limiterà perciò ad una breve discussione della dualità di Pontrjagin e dello 
spazio G delle rappresentazioni unitarie irriducibili. 


Lo spazio G. 
Gruppi topologici. 


Sia G un gruppo topologico, cioè un insieme G dotato della struttura di 
gruppo e di spazio topologico in maniera tale che sia continua l’applicazione 
GxG+G:x,ybaxy 1. 


Rappresentazioni. 


Si dice rappresentazione Y del gruppo topologico G in uno svr L una rap- 
presentazione algebrica GxL-+L:<g,x>)+T(g)x, continua rispetto a <£, x). 
Una rappresentazione 7 si dice unitaria se LZ è uno spazio di Hilbert e tutti gli 
operatori 7(g) sono unitari, cioè conservano il prodotto scalare hilbertiano. Due 
rappresentazioni unitarie 7), 7, negli spazi L,, L, sono isomorfe se esiste una 
isometria di L, con L, che trasforma 7(g) in T;(g) per ogni ge G. Una rappre- 
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sentazione 7 si dice topologicamente irriducibile se nel suo spazio L non esiste 
un sottospazio proprio chiuso invariante rispetto a tutti i T(g). 

Lo spazio G. 

Con G si indica l'insieme delle classi delle rappresentazioni unitarie irriduci- 
bili del gruppo G, con la seguente topologia. Sia 7 una rappresentazione unita- 
ria di G in L, [T] la sua classe di equivalenza. Una base di intorni del punto 
[T] in G è costituita dagli insiemi indicati con U(K, &,, ..., &,, e), dove KCG 
è un compatto, É,,...,é,6Z è un qualsiasi insieme finito di vettori, £>o è un 
numero reale. Una rappresentazione 7, nello spazio L, appartiene a tale insieme 
se e solo se esistono n;,...,Mn€L tali che per ogni ge K, î,j=1,...,n, si ha 
(TE, E) (Ti) n) <e A 

Lo spazio G si dice spazio duale del gruppo G. Nel caso in cui quest’ultimo 
sia commutativo e localmente compatto, lo stesso G ha la struttura di gruppo 
commutativo localmente compatto, e si dice duale di G secondo Pontrjagin 
(cfr. oltre). Nel caso generale G può essere uno spazio topologico con una strut- 
tura abbastanza complessa, in particolare non-separato. Osserviamo ancora che 
la restrizione alle rappresentazioni unitarie non è necessariamente la migliore; 
per i gruppi di Lie sono utili anche altre varianti. 


Esempio. G sia il gruppo diedrale infinito, Ciò significa che G è generato 
da due generatori a, # con le relazioni t*= 1, tat-1= a. In tale caso G è omeo- 
morfo all’intervallo [o, 1], con gli «estremi raddoppiati»: G= (0, 1)U {0,}U 
U {03}U {1,1}U {t2}, dove (0, 1) ha la topologia abituale, ma per t+0+ in (0, 1] 
si ha t-+0, e og in G, e per t+1— in [o, 1] abbiamo t+1; e 1g in G. sn 

Esempio. G=.SL(2, C), gruppo delle matrici 2x2 con elementi in C 
e con determinante unitario. Qui G è identificato al sottoinsieme di R?: {{n, r) | 
n>o intero, re R, r=>0 per n= 0}, e la topologia su G coincide con quella in- 
dotta da R?, con l’eccezione che, quando #-»— 1, 0) nel senso consueto, ? tende 
contemporaneamente anche a <2, 0) in G. 


Dualità di Pontrjagin. 
Struttura di gruppo su G. 


Sia G un gruppo commutativo localmente compatto. In questo caso G è 
formato esattamente dalle classi di rappresentazioni unitarie unidimensionali: 
le rappresentazioni di dimensione > 1 sono riducibili. Come nel $ 1, ciò permette 
di identificare G con lo spazio dei caratteri unitari di G, cioè gli omomorfismi 
continui G>C,= {zeC||z]=1}. La topologia su G è la topologia della con- 
vergenza uniforme sui compatti. 

La teoria della dualità di Pontrjagin consiste di due parti: una riguarda i 
gruppi, l’altra le funzioni su di essi (trasformata di Fourier). La prima parte può 
essere descritta come una serie di affermazioni, esattamente parallele a quelle 
fatte nel $ 1 per i gruppi abeliani finiti. Per non ripetere, si utilizza il linguag- 
gio funtoriale del $ 2, nel quale si possono formulare concisamente tutti i fatti 
principali. 
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TEOREMA. @) L'applicazione X : G+ G è un funtore dalla categoria dei gruppi 
localmente compatti nella categoria ad essa duale. 

b) Il funtore X è una equivalenza di categorie, ed il funtore X° è il suo inverso, 
nel senso che XX° e X°X sono equivalenti al funtore identico. 


Struttura della categoria dei gruppi abeliani localmente com- 
patti. 


La decifrazione delle affermazioni del teorema e la loro dimostrazione 
contengono come casi particolari tutte le considerazioni formulate nel $ 1 per i 
gruppi abeliani finiti. In particolare l'applicazione canonica G+G:g+y(g) 
come funzione di y è un isomorfismo topologico. 

In effetti si può descrivere in modo molto soddisfacente la struttura della ca- 
tegoria LCAb e del funtore X nel modo seguente. 


a) La categoria LCAb contiene i gruppi «elementari» R, C,<R/Z, Z e 
Z/nZ; inoltre R=-R, OESYA Z=C,, (Z/nZY = Z/nZ. 

5) Nella categoria LCAb sono definite le operazioni di somma, di prodotto, 
di limite proiettivo ed induttivo (con famiglia arbitraria di indici). 

c) La categoria LCAb è equivalente alla più piccola delle sue sottocategorie 
contenente i gruppi elementari e chiusa rispetto alle operazioni descritte. 

d) Il funtore di dualità di Pontrjagin X trasforma gruppi elementari in ele- 
mentari (a meno di isomorfismi), e prodotti e limiti proiettivi rispettiva- 
mente in somme e limiti induttivi, e viceversa. Il gruppo G è compatto se 
e solo se G è discreto. 


Trasformata di Fourier. . 


Integrazione invariante. 


Su ogni gruppo localmente compatto G con una base numerabile (di intorni 
dell’identità) è definita una misura di Borel regolare c-finita non nulla invariante 
rispetto alle traslazioni sinistre: G+G:x+gx, ge G. Essa è definita univoca- 
mente a meno di una costante moltiplicativa, ed è detta misura di Haar (sinistra). 
Un’affermazione analoga è vera per le misure invarianti a destra. La scelta della 
costante moltiplicativa si dice normalizzazione; se G è compatto, le misure spesso 
si normalizzano in modo che la misura di G sia uguale a 1. In notazione inte- 
grale invece di du(g) per la misura di Haar sinistra scriveremo dg, per quella 
destra d,g, e per quella bilaterale (in particolare per i gruppi abeliani) dg. 

Esempi di misure invarianti sono: dx su R, x! dx su R*; la misura p su 
Z,, per la quale la misura del sottogruppo aperto UCZ, è uguale a 1/[Z,: U]. 


Trasformata di Fourier. 


Sia G un gruppo localmente compatto abeliano. La trasformata di Fourier 
può essere definita come l’applicazione F: L,(G, dg) +L,(G, dy): ff, dove 
F1)= SafE)x(e)de 


Dualità 176 


Nel novero delle affermazioni sulla dualità rientrano i seguenti fatti: 

Le misure di Haar dg e dy possono essere normalizzate in modo tale che l’ap- 
plicazione inversa di F possa essere definita dalla formula f(g)= SefWy(eY 1dy. 

Tali misure si dicono duali. Per esempio, se G è compatto e Jedg=1, allora 
G è discreto e la misura duale di ogni punto di G è uguale ad 1. 

Nel caso G=R/Z.si ottiene la costruzione classica della serie di Fourier 
(R/Z)Y Ze fe-2rina) e f, come funzione su Z, cioè come successione {f,}, 
è la successione dei coefficienti di Fourier della funzione f. 

Nel caso G=R si ottiene la costruzione classica dell’integrale di Fourier 
R=R (accoppiamento (p, x) e-2ri22) e f(p)= ( 1/v2r)ftzf(Me ri. 


Negli stessi casi è verificata l’uguaglianza di Parseval: 
[ure=[ ora 
G & 


In particolare, per G=R/Z, si trova l'uguaglianza classica: 


fiera È ihr 


Da ciò segue che la restrizione della trasformazione di Fourier n L3(G, dg) 
si estende ad una isometria degli spazi di Hilbert L,(G, dg) x Ls(G, dy). 


Esempio: osservabili coniugate in meccanica quantistica e 
principio di indeterminazione. Si ricordi che un sistema quantistico è 
descritto dallo spazio di Hilbert dei suoi stati, IC, e dagli operatori lineari con- 
tinui autoaggiunti 4 agenti su di esso (osservabili). Le osservabili A corrispon- 
dono a grandezze fisiche classiche (energia, impulso, coordinate) o non-classiche 
(spin). Uno stato puro del sistema è un raggio complesso in IC; se Y è un vet- 
tore in esso, con ||y]| =1, Ia misura della grandezza A nello stato y dà, in ge- 
nerale, un risultato indefinito, per il quale si può predire soltanto una distri- 
buzione di probabilità. In particolare il valor medio di una misura è uguale a 
(Ad, D)=<A>y, e la dispersione è uguale a (A4)y= |[[A-<A)y]W]. 

Le osservabili 4,, ..., 4, formano un sistema completo di osservabili com- 
patibili se I può avere una realizzazione come Ls(M, u), dove MCR”, 4 è 
una misura su R”, e A; = moltiplicazione per la i-esima coordinata di R”. 
Questa realizzazione si dice adattata alla famiglia A,, ..., An; gli operatori 4,, 
A; commutano, 

Per esempio, le osservabili di posizione X,, Xg, X; di una particella libera 
(senza spin e nell’approssimazione non relativistica) agiscono come operatori di 
moltiplicazione per x,, x,, «3 sulle funzioni lisce a supporto compatto y(x,, x9, 
x3) di H= L,(R*) (convenientemente estesi ad operatori autoaggiunti su tutto 7). 
In questa «rappresentazione coordinata» le osservabili corrispondenti alle 
proiezioni degli impulsi P,, P., P; sono le estensioni degli operatori 

ò 


P;= —ih 


i 
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(4 è la costante di Planck). Inversamente, nella rappresentazione degli impulsi 
sulle funzioni È(p,, fs, ds) le osservabili di posizione hanno la forma 


òp; 
e gli impulsi P;= moltiplicazione per p;. L’isomorfismo delle due rappresenta- 
zioni, che identifica le funzioni d’onda ù di uno stesso stato fisico, è dato dalla 
trasformata di Fourier dal gruppo localmente compatto R? (coordinate) nel suo 
duale R3 (impulsi): 


Ùby Da» ds) =FW(Py da Ps) = CSI, si e i@pesptemo/h (x) de, dxy dxg. 


Corrispondentemente si trasformano le osservabili: X;=FX;F TÈ P,= FP;F 5 

Ciò spiega uno degli aspetti dell’uso del termine ‘osservabili coniugate’ in re- 
lazione alla coppia coordinate-impulsi: le corrispondenti osservabili sono coniu- 
gate rispetto alla trasformazione di Fourier. Per lo stesso motivo si dicono co- 
niugate le rappresentazioni delle coordinate e quelle degli impulsi. 

Se A e B sono due osservabili, le dispersioni dei risultati di una loro misura 
nello stato y sono connesse dalla disuguaglianza (AA)y(AB)y=|G[A, B].y/2, 
dove [ A, B]= AB— BA. In tal modo, se A e B non commutano sullo stato , 
cioè |{i[A, B]>y| #0, allora in tale stato le grandezze fisiche A e B non possono 
avere simultaneamente un valore esatto: il prodotto delle loro dispersioni è in- 
feriormente limitato. Questa è la relazione d’indeterminazione di Heisenberg. 
Dato che [X;, P,]=?4d;x:(d,=1 per j=& e o per j#), la j-esima coordinata 
della particella e la proiezione del suo impulso sul j-esimo asse coordinato non 
possono avere contemporaneamente valori esatti: Ax;Ap;>4/2. I motivi intui- 
tivi di ciò (a livello di modelli matematici) sono stati discussi nell’articolo « Con- 
tinuo/discreto »: una particella con valore definito dell'impulso (cioè ben loca- 
lizzata nello spazio degli impulsi) ha come funzione y un’onda armonica nello 
spazio delle coordinate, e perciò è assolutamente non-localizzata in esso. Per lo- 
calizzare una particella nello spazio delle coordinate occorre raccogliere il «pac- 
chetto d’onda », nel quale entrano le componenti armoniche con dispersione 
delle componenti degl’impulsi (numeri d’onda) e, quanto più è spazialmente 
compatto questo pacchetto d’onda, tanto più forte è questa dispersione. 


La circostanza che una funzione e la sua trasformata di Fourier, che si pre- 
sentano da un certo punto di vista come un unico oggetto, posseggano nello 
stesso tempo proprietà complementari per quanto riguarda le loro localizzazioni, 
s'incontra in diversi contesti. 

Ad esempio, per una funzione f con supporto compatto in R” si definisce 

n de 
la norma |f]î,,=Srel(1+|x|F}+A))f|? dx, dove A= wir La chiusura 
rispetto a questa include le funzioni che hanno 2/ derivate decrescenti all'infinito 
come |x|®+-?. La chiusura, nella topologia corrispondente a tutto il sistema di 
norme, è lo spazio di Schwartz. La trasformata di Fourier lo trasforma in sé, e 
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inoltre |f]x,:= | É lx. Ciò indica che dal punto di vista della trasformata di 
Fourier risultano complementari le proprietà di regolarità da una parte, e quelle 
di decrescenza rapida all’infinito (cioè del tipo di localizzazione) dall’altra. 

Infine, la trasformata di Fourier si può definire per alcuni spazi di funzioni 
generalizzate (lentamente crescenti) mediante l’uguaglianza di Parseval. Po- 
nendo T(u)= T(@) (T è una distribuzione, u una funzione fondamentale), si 
trova, ad esempio: do = [1/(27)]7, (7 è la distribuzione «+ {ga dx, corri- 
spondente alla funzione f=1). Qui il carattere complementare della localizza- 
zione di S, e di $, si presenta nella forma estrema: punto/spazio. 

Cosî come uno spazio simplettico unifica uno spazio e il suo duale in un unico 
oggetto, si possono unificare uno spazio di funzioni e quello delle loro trasfor- 
mate di Fourier in uno spazio di funzioni con un numero di variabili doppio. In 
quest'ultimo, oltre all'operatore trasformata di Fourier, agiscono operatori più 
generali, introdotti da Hòrmander. Questo approccio, che include necessaria- 
mente anche l'esame della struttura simplettica sullo spazio delle variabili, per- 
mette di considerare da un unico punto di vista molte questioni di teoria delle 
equazioni differenziali alle derivate parziali. [1. M. G. e Ju. 1. M.]. 


L’idea di dualità ha un carattere estremamente generale, sia nelle matematiche, sia 
in fisica, in particolare nella meccanica quantistica (cfr. quanti, particella), sia in biolo- 
gia (cfr. genotipo/fenotipo). In effetti essa è presente in tutte le coppie filosofiche, sia 
come dualità fenomenologica (ad esempio puro/impuro, dipendenza/indipendenza, 
equilibrio/squilibrio) sia come presenza/assenza di un contrassegno (ad esempio uomo/ 
donna, salute/malattia) sia infine come complementarità di carattere metodologico (ad 
esempio analisi/sintesi, soggetto/oggetto, locale/globale). 

In questo articolo sono illustrati gli usi in matematica del termine ‘dualità’ : in logica 
(cfr. anche insieme, assioma/postulato), in algebra (cfr. continuo/discreto, appli- 
cazioni, simmetria, razionale/algebrico/trascendente, divisibilità), in geometria, 
in analisi funzionale (cfr. spettro, calcolo). 
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1. I problemi fondamentali. 


Se nella matematica contemporanea esiste un concetto «più importante d 
senza dubbio si tratta del concetto di insieme. Un accurato esame degli arti- 
coli comparsi nelle maggiori riviste matematiche degli ultimi decenni farebbe 
scoprire che la maggior parte dei concetti matematici più studiati è costituita 
da insiemi dotati di una struttura. Le rassegne storiche della matematica del xXx 
secolo sono, d’altro lato, dedicate in misura considerevole al ruolo della teoria 
degli insiemi nei fondamenti della matematica, ai paradossi della teoria degli 
insiemi, alla crisi dei fondamenti e alla constatazione dell’assenza di un accordo 
generale sul modo di uscire da questa crisi. | Do 

In effetti la formulazione della teoria degli insiemi nei lavori di Georg Can- 
tor negli anni ’70-80 del secolo scorso si è rivelata la causa fondamentale della 
ristrutturazione di tutta la matematica, oltre che un catalizzatore di profondi e 
difficili processi della propria autocoscienza. La penetrazione del pensiero in- 
siemistico in tutte le discipline matematiche si è accompagnata con il ricono- 
scimento dell’unità e della forza vitale dell'immenso organismo delle conoscenze 
matematiche, con la creazione di concetti e di formalismi efficienti non solo in 
fisica e nella pratica, ma che hanno lasciato una profonda impronta anche sul 
carattere delle scienze umanistiche. Contemporaneamente queste considerazio- 
ni di linguaggio e di semantica della teoria degli insiemi hanno condotto a di 
interpretazione assolutamente nuova della natura della verità matematica, del- 
la dimostrazione, dell’infinito; alla scoperta di problemi non decibibili; a una 
profonda divisione degli specialisti di logica e di filosofia della matematica in 

iverse scuole e gruppi. i 

2 Lea in di insieme presenta notevoli difficoltà a causi 
della sua centralità, della sua irriducibilità a concetti matematici più elementari. 
Il metodo per introdurre i concetti fondamentali in matematica non è sostan- 
zialmente cambiato dai tempi di Euclide, costretto a definire «punti» e «rette» 
prima di formulare gli assiomi della sua geometria. E cambiato soltanto il grado 
di consapevolezza delle nostre attività, cosa che ha permesso di chiarirne le 
relazioni dal punto di vista della filosofia della scienza. 

Tale metodo consiste nel condurre l’esplicazione parallelamente da duc 
punti di vista fra loro complementari: quello «significativo » o «intuitivo » da una 
parte, quello «formale» dall’altra. . DEE 

La definizione intuitiva di insieme come «unione in un tutto di oggetti di- 
stinti della nostra intuizione o del nostro pensiero » (Cantor) si appella ad alcuni 
archetipi fondamentali ed eccessivamente generali del pensiero umano (a cui si 
riferisce anche la definizione euclidea di punto come «posizione senza lunghezza 
e larghezza»). Questi archetipi senza dubbio sono suscettibili di ulteriore Li 
dagine coi metodi della psicologia e della neurofisiologia (in particolare per ri 
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solvere il problema del ruolo relativo delle strutture della conoscenza — innate 
o acquisite con lo studio —, e della loro formazione). Tuttavia qualsiasi ricerca 
del genere conduce oltre i confini propri della matematica. Queste definizioni 
svolgono il ruolo del diapason per accordare le diverse conoscenze individuali 
sullo stesso tono, ma esse stesse si trovano fuori della matematica, cosa che è ine- 
vitabile nell’introduzione dei concetti fondamentali, a meno di assumere in ma- 
niera del tutto conseguente un altro punto di vista, quello formale. 

Le definizioni formali non sono propriamente considerate concetti, ma ter- 
mint. I termini iniziali non sono defîniti; solo i contesti nei quali sono usati cor- 
rettamente sono suscettibili di una descrizione. I termini composti sono abbre- 
viazioni di determinati testi costituiti dai termini iniziali. 

Per le applicazioni agli insiemi, ciò significa che occorre fissare il linguaggio 
nel quale si deve parlare degli insiemi. Questo linguaggio può essere completa- 
mente formalizzato, vale a dire costruito per intero in modo artificiale con regole 
sintattiche rigorose (cfr. $ 2), o comprendere frammenti più o meno grandi di 
linguaggio naturale (cfr. l'articolo «Assioma/postulato» di questa stessa Enci- 
clopedia). In ogni modo devono essere definite in maniera il più possibile netta, 
in primo luogo, le regole di formazione delle frasi, includenti i nomi degli in- 
siemi, il predicato «appartenere a» e i termini logici («se ... allora», «e», «0», 
«non», «per ogni», ecc.), in secondo luogo, le regole di formazione delle suc- 
cessioni di frasi, da considerarsi dimostrazioni matematiche di teoria degli in- 
siemi. La semantica di un tale linguaggio, vale a dire le regole di comprensione 
del «significato » delle frasi e delle dimostrazioni, in linea di principio, può esse- 
re completamente sottaciuta. 

Si capisce che le concezioni «intuitiva» e «formale» della teoria degli insiemi 
(e della matematica in generale) sono in realtà strettamente connesse. I formali- 
smi della teoria degli insiemi sono sorti come risultato della scoperta di conte- 
sti apparentemente naturali nei quali l’uso della parola ‘insieme’, nel senso di 
Cantor, conduce rapidamente a contraddizioni logiche (si veda la descrizione 
del paradosso di Russell nel $ 5 dell’articolo « Assioma/postulato »). I tentativi 
di escludere la comparsa di questi contesti per mezzo di divieti puramente 
linguistici, che conservassero le procedure semiintuitive della versione insiemi- 
stica della matematica classica, hanno condotto ad assiomatizzazioni della teoria 
degli insiemi quali il sistema di Zermelo-Fraenkel, di Neumann, di Gòdel-Ber- 
nays. Ma la scelta stessa di questi divieti era motivata proprio dalle rappresen- 
tazioni intuitive relative alle motivazioni delle difficoltà incontrate (come la 
descrizione di insiemi definiti «da se stessi» o «troppo grandi », ecc.). Per questo 
la cristallizzazione dei linguaggi formali si è accompagnata anche a una deter- 
minata precisazione della forma intuitiva dell’«insieme», per la quale la defini- 
zione di Cantor risultava soltanto il punto storico d’inizio. Purtroppo in questo 
modo non si è sviluppata un’unica rappresentazione generale per l’insieme ma- 
tematico e un attento esame del problema fa vedere che è poco probabile che 
essa possa nascere. 

La consapevolezza della suddivisione della matematica in «testo» e « signi- 
ficato » è il frutto dell’introduzione del programma di Hilbert come base per 
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la matematica, Questo programma non servi per la soluzione dei problemi po- 
sti da Hilbert, ma presto permise di scoprire che essi erano mal posti. 

Secondo Hilbert il ruolo del formalismo doveva consistere nel garantire 
l’attendibilità delle considerazioni matematiche, per mezzo della verifica della 
loro non-contraddittorietà formale, indipendentemente dal contenuto. Questa 
verifica, per ipotesi, doveva svolgersi con metodi più attendibili (finitistici) di 
quelli usati dalla teoria intuitiva degli insiemi. Tuttavia Gòdel dimostrò che lo 
studio del formalismo intuitivo è un problema matematico di per sé tanto dif- 
ficile che nella dimostrazione della sua non-contraddittorietà non è sufficiente 
usare neppure i metodi descrivibili con questo formalismo; e in ogni caso i 
metodi finitistici non possono bastare. 

In un ambito più ampio il ruolo del formalismo potrebbe almeno consistere 
nel contribuire al chiarimento dell’intuizione necessaria a garantire una com- 
prensione unitaria dell’«insieme» e nel fondare la verità sulla non-contraddit- 
torietà della teoria degli insiemi, almeno nella stessa misura in cui ciò è corretto 
per il concetto di numero e di aritmetica elementare. In qualche misura questo 
scopo è stato raggiunto. Nicolas Bourbaki e le sue idee, accettate dalla grande 
comunità matematica internazionale, dimostrano sia l’estesa diffusione di una 
unità di punti di vista sugli insiemi, sia una grande produttività dei principî 
insiemistici. In maniera grossolana si può dire che nella pratica è stato dimo- 
strato che, entro limiti noti e abbastanza ampi, la non-determinatezza del con- 
cetto stesso di insieme non altera la comprensione unitaria, la produzione, lo 
scambio e la valutazione dei testi matematici, nei quali svolge un ruolo fonda- 
mentale. Tuttavia non si possono chiudere gli occhi di fronte alla reazione di 
gruppi di matematici (intuizionisti, costruttivisti) poco numerosi ma con seri 
argomenti, i quali mettono in guardia sui pericoli possibili lungo questa strada. 
Queste argomentazioni verranno riprese nell’ultimo paragrafo di questo articolo. 

Sotto queste condizioni l’assunzione di un punto di vista unitario sugli 
insiemi conduce a una netta unificazione dell’intuizione, della tecnica e delle 
possibilità potenziali della matematica in quanto scienza. La stessa cosa è 
senz'altro valida per l’esplicazione di qualsivoglia sistema alternativo di concetti, 
che possa essere posto a fondamento della matematica in futuro. Si ritiene che 
il carattere di complementarità (nel senso di Bohr) degli aspetti intuitivi e forma- 
li delle teorie matematiche sia una delle principali lezioni della metamatematica 
del xx secolo. È parallelo alle analoghe lezioni gnoseologiche della microfisica e 
della biologia. La profonda dualità dei concetti di testo e significato manifesta- 
tasi inizialmente nei modelli matematici sia di testi (linguaggi formali) sia di 
significati (le loro interpretazioni), ha senza dubbio un valore generale. Il signi- 
ficato non può essere esplicato e oggettivato al di fuori del testo; ma il testo 
non è in grado di trasmettere né «tutto il significato), né «solo questo signifi- 
cato ». In matematica ciò è vero più che in altre scienze, i cui testi hanno spesso 
un significato pragmatico esterno a loro. Una comprensione più profonda sia 
della semantica sia dei problemi dei fondamenti della matematica può essere rag- 
giunta ampliando, e non restringendo, i fatti e i metodi in considerazione. La ma- 
tematica non è un gioco puramente formale, né un prodotto della pura intui- 
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zione individuale; è un aspetto dell’attività. della comunità delle coscienze indi- 
viduali nel mondo esterno, e solo tenendo conto di una quantità di fattori mag- 
giore di quella considerata finora si può giungere alla costruzione di un modello 
verosimile della matematica, nel quale gli aspetti intuitivo e formale risultino 
elementi di una stessa unità. 

n Tornando al linguaggio della teoria degli insiemi (considerato in dettaglio 
pit oltre, come pure negli articoli « Assioma/postulato », « Applicazioni », « Strut- 
ture matematiche », che con questo articolo formano un complesso unitario) è 
opportuno indicare subito i tratti caratteristici di questo linguaggio, i quali 
l'hanno proprio posto al centro delle considerazioni precedenti. Dal nostro 
punto di vista sono la sua economicità, l’universalità e «l’accesso diretto » ai pro- 
blemi dell’infinito. 

L’economicità dei metodi espressivi del linguaggio della teoria degli in- 
siemi si manifesta nell’uso, oltre che dei metodi logici, di due soli predicati non 
definiti, «essere un insieme» e «appartenere a». All’inizio (in particolare con 
Cantor) a questi si aggiungeva un numero non grande di predicati del tipo 
«essere una funzione» oppure «essere una relazione », ma in seguito si dimostrò 
come anche questi si riducano ai due originali (cfr. $ 3). Grazie alla economicità 
del linguaggio degli insiemi, la sua formalizzazione graduale e la sua arialisi 
logica furono comode pietre di paragone per la formazione di metodi di ricerca 
metamatematica (fra l’altro questa stessa funzione è condivisa col linguaggio 
dell’aritmetica elementare, la cui superiorità consiste in una trasparenza della 
semantica notevolmente maggiore). 

, PT universalità del linguaggio della teoria degli insiemi si è manifestata prima 
di tutto nella rapida formulazione di tecniche di traduzione di tutti i concetti 
della matematica classica in questo linguaggio, a seguito della quale si scopri 
la loro unità interna, mascherata da una varietà di termini e d’intuizioni delle 
epoche precedenti. Il successivo sviluppo della matematica ha dimostrato l’ec- 
cezionale comodità del linguaggio degli insiemi, congiunto a variabili metalin- 
guistiche del tipo «strutture» di Bourbaki, per collegare, scoprire e precisare 
nuovi fatti matematici. Oltre a ciò il linguaggio degli insiemi si rivelò tanto 
adattabile da accogliere in sé un intero spettro d’interpretazioni di approcci al- 
ternativi ai concetti principali della matematica, spesso contrari, nello spirito 
alla teoria degli insiemi. Ad esempio tutta la matematica costruttiva, eretta in- 
torno al concetto di algoritmo, senza alcuna difficoltà «si immerge in maniera 
isomorfa» nella matematica insiemistica, sebbene i costruttivisti contestino la 
sensatezza di questa immersione. Lo stesso vale per la logica intuizionista. 

Infine i problemi di Cantor sull’infinito attuale hanno svolto in matematica 
un ruolo veramente particolare. «L’infinità nuda» di elementi distinguibili ma 
non aventi alcuna altra individualità, secondo Cantor, ha aperto alla coscienza 
matematica una serie di procedimenti concettuali di valore unicò, quali il 
procedimento di diagonalizzazione, l’induzione transfinita, l’assioma della scel- 
ta. Questi procedimenti conservano il loro significato anche sotto interpre- 
tazioni nettamente diverse. La possibilità stessa di considerare matematica- 
mente significativa l’infinità attuale, liberandola sia da strutture addizionali non 
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essenziali, sia dalla barriera psicologica di due millenni, è stata una scoperta 
di grandissima importanza che ha valore per tutte le scienze. In qualunque modo 
si valuti il risultato del successivo periodo di dura critica alle «teorie dell’infi- 
pito », la dimostrazione della loro stessa esistenza è un momento cruciale nella 
storia della scienza, le cui lezioni sono imperiture. 


2. Teorie formali degli insiemi. 


Nell’articolo «Assioma/postulato » sono stati descritti a livello qualitativo 
il linguaggio della teoria degli insiemi, i suoi assiomi e la semantica; nell’arti- 
colo «Applicazioni» sono state riportate alcune costruzioni fondamentali della 
teoria degli insiemi. Per questo si comincia qui con l’introduzione del linguag- 
gio formale della teoria degli insiemi. i 

La descrizione di un linguaggio formale L si riduce in generale alle seguenti 
componenti: a) la descrizione dell’alfabeto A del linguaggio: l’insieme dei suoi 
simboli; 5) la descrizione delle regole di formazione di particolari successioni 
finite di simboli: le espressioni «sensate». Queste descrizioni solitamente si 
accompagnano con convenzioni relative ad abbreviazioni di scrittura (senza le 
quali i testi nel linguaggio formale diverrebbero rapidamente lunghi in maniera 
eccessiva), con commenti relativi a equivalenze verbali di enunciati formali e 
con la spiegazione del loro significato intuitivo; c) la descrizione delle regole 
di formazione di testi particolari — successioni finite di espressioni sensate, le 
quali costituiscono le deduzioni formali, vale a dire i modelli formali delle di- 
mostrazioni matematiche. Queste regole di formazione possono essere scelte 
in diversi modi; uno dei metodi essenziali per variarle è assumere questi o 
quegli assiomi formali, queste o quelle regole di deduzione. Ogni scelta delle 
regole di deduzione formale definisce una teoria formale sul linguaggio L. 

Si descriverà ora il particolare linguaggio del primo ordine della teoria degli 
insiemi L, Set, secondo l’assiomatica di Zermelo-Fraenkel. 


2.1. Alfabeto del linguaggio della teoria degli insiemi L, Set. 


Si suddivide nei seguenti gruppi: 

a) un insieme numerabile di simboli per le variabili x,y, 2, ... dotati di 
indici; 

b) il simbolo dell’insieme vuoto D;. 

c) il simbolo della relazione «appartenere a» €; 

d) il simbolo della relazione di uguaglianza =; i 

e)i simboli dei connettivi logici e dei quantificatori, + (equivalenza), 
+ (implicazione), V (o non esclusivo), A (e), — (non), V (quantifica- 
tore universale), X (quantificatore esistenziale); 

f)le parentesi «(» e «)». 
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2.2. Formule del linguaggio L, Set. 


Le espressioni sensate del linguaggio L, Set si chiamano formule. L'insieme 
delle formule è definito mediante le seguenti regole di formazione: 


a) se X, Y sono due variabili oppure @, e se * è uno qualunque dei sim- 
boli =, e, allora X#Y è una formula; 

b) se P e O sono formule e se x è una variabile, allora (P) è (0), 
(P)> (0), (P)V(0), (P)A(0), (2), Va(P), Ax(P) sono formule; 
c) l'insieme delle formule è esaurito dalle espressioni che si possono costruire 

applicando le regole 2) e 5). 


Le formule descritte dalle regole 4) si dicono atomiche. Ogni formula che 
non sia atomica può essere univocamente rappresentata esattamente in una delle 
sette forme descritte dalle regole 5). Le componenti P, Q che entrano nella 
corrispondente rappresentazione di una formula originaria possono essere a loro 
volta sia atomiche sia rappresentabili in una di queste forme. Questo procedi- 
mento di analisi sintattica si svolge meccanicamente e permette di costruire 
ogni formula a partire da quelle atomiche. Le definizioni fondamentali e i teo- 
remi metalinguistici relativi alle formule di L, Set si stabiliscono per indu- 
zione sulla lunghezza delle formule, a partire da quelle atomiche. 

Un esempio importante di questo procedimento è la definizione di occorren- 
ze libere e vincolate delle variabili in una formula. Tutte le occorrenze delle 
variabili in una formula atomica sono considerate libere. Nelle formule Vx (P), 
Ux(P) tutte le occorrenze della variabile x sono considerate vincolate, mentre 
le occorrenze delle altre variabili dipendono da P. Nelle rimanenti cinque for- 
mule della regola 5) le occorrenze delle variabili sono considerate le stesse delle 
occorrenze a loro corrispondenti nelle sottoformule P, O. La variabile x è li- 
bera in P se almeno una delle sue occorrenze è libera in P. 

La traduzione verbale delle espressioni del linguaggio L, Set si realizza per 
mezzo delle seguenti regole non formali: 


1)i simboli di variabile x, y, 2, ... sono nomi di insiemi indeterminati; il 
simbolo 4 è il nome dell’insieme vuoto; 

2) la formula atomica xey si legge «L’insieme x appartiene all’insieme y» 
o in qualche maniera sinonima; la formula atomica x = y si legge « L’in- 
sieme x è uguale all’insieme y»; 

3) la lettura delle formule (P) © (0), ..., dx (P) deve risultare chiara dalle 
denominazioni dei simboli dei connettivi e dei quantificatori. In tal modo 
le formule sono scritture di enunciati relativi a insiemi indeterminati. 


Poiché la sintassi del linguaggio naturale non è normalizzabile tanto netta- 
mente quanto la sintassi di L, Set e non ammette catene troppo lunghe di 
frasi connesse l'una all’altra, la traduzione richiede delle abbreviazioni, delle 
approssimazioni espressive, ecc. 
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Si dànno qui alcuni esempi di formule e di loro traduzioni: 


(Va((zex) è (267))) è (x=y): «Gli insiemi x e y sono uguali se e so- 
lo se ogni insieme 2 che appartiene a x appartiene anche a y e viceversa». 
Si tratta della scrittura in linguaggio formale dell’assioma di estensionalità 
(cfr. l'articolo «Assioma/postulato», $ 4, in questa stessa Enciclopedia). 

—a(dx(xe Z)): «Non è vero che esiste x appartenente all'insieme vuoto». 


È naturale considerare la formula P come un enunciato precisamente relativo 
a quegli insiemi i cui simboli sono liberi in P. I simboli vincolati dai quantifi- 
catori V ed 4 svolgono il ruolo di variabili ausiliarie nella formula considerata. 
Con l'introduzione del concetto di modello, o interpretazione di un linguaggio 
formale, alcune formule, fra cui tutte quelle chiuse, vale a dire non contenenti 
variabili libere, risultano univocamente determinate per quanto riguarda la 
loro verità: esse sono vere o false. In generale, per le formule contenenti va- 
riabili libere risulta determinata la verità solo dopo che a queste variabili è 
assegnato un determinato valore (per maggiori particolari cfr. $ 4). 


2.3. Assiomi particolari formali del linguaggio L, Set. 


| Tutti gli assiomi di Zermelo-Fraenkel (ZF1-ZF10) riportati nel $ 4 dell’ar- 
ticolo « Assioma/postulato » possono essere tradotti nel linguaggio formale, ana- 
logamente a quanto è stato fatto per l’assioma di estensionalità e per l’assioma 
dell’insieme vuoto. Le formulazioni verbali degli assiomi ZF1-ZF1o sono sta- 
te scelte in modo da facilitare al massimo la possibilità di questa traduzione al 
lettore interessato. ' 

Due casi richiedono commenti a parte. 

In primo luogo negli assiomi ZF7-ZFy9 figurava il concetto di «proprietà 
dell’insieme degli 2). Occorre sostituirlo con il concetto di «formula del lin- 
guaggio L, Set nella quale solo la variabile 2 compare libera». In altri termini 
si riduce il concetto di «proprietà di un insieme» al concetto di «proprietà 
esprimibile nel linguaggio L, Set». Poiché nel linguaggio L, Set non ci sono 
metodi per tradurre l’espressione «insieme qualsiasi» (i quantificatori VP 
sulle formule variabili P non sono ammessi), l’assioma ZF si trasforma in uno 
«schema di assiomi formali», un assioma formale per ogni formula P(z) con 
la variabile libera 2, della forma 


Valy Velzey>(zex A P(a))) 


In questa scrittura, come è accettato, sono state omesse tante parentesi quante 
può ricostruire senza troppa difficoltà il lettore attento. In maniera analoga, 
solo leggermente più complicata, si tratta l'assioma ZF8, nel quale compaiono 
le proprietà delle coppie ordinate di insiemi. Questa precisazione del significato 
da attribuire al concetto di «proprietà» è il primo apporto essenziale della for- 
malizzazione del linguaggio nella teoria intuitiva degli insiemi. Raggiungere 
questo scopo con metodi essenzialmente diversi sarebbe stato alquanto diffi- 
coltoso. D'altro lato questo scopo è raggiunto a caro prezzo: la limitazione 
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del numero di proprietà che si possono considerare. Soltanto un continuo pro- 
cesso di traduzione della matematica nel linguaggio L, Set può mostrare che 
le proprietà esprimibili in L, Set sono sufficienti. 

In secondo luogo nella formulazione degli assiomi ZF1-ZFio si sono spesso 
usate abbreviazioni per designare insiemi la cui esistenza era assicurata da 
assiomi: {x,y}, P(x), ecc. È comodo ottenere in due passi la traduzione delle 
espressioni verbali in cui compaiono queste denominazioni in linguaggio for- 
male. Al primo passo si costruisce una «quasiformula » per mezzo di e, =, i 
connettivi e i quantificatori, nella quale possono rientrare sia le variabili sia 
i «termini » del tipo {x,y} 0 P(x). Al secondo passo ogni termine di questo 
tipo viene sostituito da una nuova variabile, ad esempio 2, e per 2 si dà una 
corrispondente «definizione» con variabili ausiliarie. Ad esempio la «quasifor- 
mula» P(x)ey si trasforma nella formula 


(ey) A Vulvez è Vu(wev + we y)). 


Negli studi sulla teoria formale degli insiemi (e in generale sui linguaggi 
formali) abbreviazioni di scrittura come l’uso di quasiformule si producono in 
continuità, 


2.4. Assiomi logici del linguaggio L, Set. 


Fanno parte di questi alcune serie di formule chiaramente descrivibili, ad 
esempio le tautologie, come P-+(0+P) oppure =—=PeP, assiomi con quan- 
tificatori come VxaPotxP e VxaP+P(y) (dove P(y) è la scrittura risul- 
tante dalla sostituzione del simbolo y al posto di tutte le occorrenze libere del 
simbolo x nella formula P), e infine assiomi di uguaglianza, come x=y + 
> (P(x)+P(9)). 

Gli assiomi logici sono equivalenti formali di espressioni di significato ge- 
nerale, la cui verità, di fatto, non dipende dall’interpretazione delle loro com- 
ponenti. 


2.5. Deduzioni formali nel linguaggio L, Set. 


Sia & un insieme di formule del linguaggio L, Set. Si dice deduzione for- 
male da & una successione di formule P., ..., P,, del linguaggio che abbia le 
seguenti proprietà: per ogni î<n, P;e &; oppure P, è della forma VxP, con 
13. oppure fra le formule P., ..., P;_, c'è una formula del tipo P.+P; con 

SI. 

In altri termini, ogni formula P; della deduzione è una formula di & oppure 
è una conseguenza immediata della formula precedente P; mediante la regola 
GEN (generalizzazione), oppure è una conseguenza immediata di formule pre- 
cedenti P,, P,>P; mediante la regola MP (modus ponens). 

La deduzione formale P,, ..., P, «deduce» da & l’ultima formula P,. 

Se è è la totalità degli assiomi particolari e degli assiomi logici del linguag- 
gio L, Set, allora le sue deduzioni formali sono corrispondenti alle dimostra- 
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zioni di teoria degli insiemi: ogni deduzione formale «dimostra» la sua ultima 
formula. La totalità delle formule deducibili da un dato sistema di assiomi 
costituisce (una delle) teorie formali degli insiemi. 


2.6. Proprietà collettive ed estensioni del linguaggio L, Set. 


4 


Come è stato osservato in «Assioma/postulato» quasi tutti gli assiomi di 
Zermelo-Fraenkel postulano l’esistenza di un insieme x costruito a partire da 
alcuni insiemi dati y,, ..., Y, per mezzo di una qualche costruzione. Oltre a 
ciò, i più importanti sono i casi in cui x è definito univocamente a partire da 
Vi: ++, indicando che tutti gli elementi yex devono possedere insieme a 
Vi; +9, una certa proprietà P. Di questo tipo sono l'assioma della coppia 
ZF3 (ove Pè y=y;j V y = y9) l'assioma dell’unione ZF4 (ove P è Uzx(y e 3 A 
A 2 € y;)) e altri. 

Nella teoria formale la formula P(y;,, ...,9,) si dice collettiva per y se 
in questa teoria è deducibile la formula Ux(y e x è P(4;v, ...,.9,)). Nella 
teoria intuitiva degli insiemi a ogni proprietà collettiva P si può far corrispon- 
dere l’operazione di riunione degli insiemi y con la proprietà P; il risultato di 
questa riunione è l'insieme usualmente denotato {y| P(y;%, -.-.9,)}. Per pro- 
prietà P particolarmente importanti possono essere scelte speciali denomina- 
zioni, come {y, y2} (la coppia) oppure P(x) (le parti di x). È stato spiegato 
sopra come sia possibile fare a meno di questi insiemi «composti» o «termini», 
nella traduzione, nel linguaggio L, Set, di espressioni semiverbali contenenti 
questi termini. È tuttavia Hossbile anche un’altra strada: quella di estendere 
il linguaggio formale aggiungendo alle espressioni ammissibili: a) termini per 
le operazioni, definiti induttivamente, rispondenti a qualche proprietà collet- 
tiva della data teoria; 5) tutte le formule atomiche del tipo #,€t,, t,=%, in 
cui si trovino termini, vale a dire tutti i nomi degli insiemi; c) tutte le for- 
mule ottenibili da quelle atomiche per mezzo dei connettivi logici e dei quan- 
tificatoti. Aggiungendo all’elenco degli assiomi particolari della teoria le for- 
mule che definiscono i termini corrispondenti ed estendendo alquanto l’elenco 
degli assiomi logici per includervi gli assiomi con termini, si ottiene un’esten- 
sione di questa teoria in un linguaggio ampliato. Si può dimostrare un teorema 
del tutto naturale sul fatto che, nella teoria estesa, sono dimostrabili solo le 
formule equivalenti a formule dimostrabili nella vecchia teoria, di modo che 
queste estensioni di linguaggio sono inessenziali da un punto di vista logico 
e vi si può ricorrere se ciò risulta comodo da un punto di vista tecnico. 


2.7. Problemi di metateoria delle teorie formali degli insiemi. 


Nel $ 3 di «Assioma/postulato » è stato dato un elenco dei concetti fonda- 
mentali della metateoria delle teorie assiomatiche, con brevi commenti. Nel- 
l'applicazione alle teorie formali questi concetti sono sottoposti a una notevole 
precisazione e i problemi ad essi collegati diventano questioni formulabili in 
maniera precisa dal punto di vista matematico. 
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Cosi la non-contraddittorietà formale degli assiomi di Zermelo-Fraenkel si- 
gnifica che non esiste una formula P nel linguaggio L, Set tale che Pe P 
siano contemporaneamente deducibili dagli assiomi formali (affermazione equi- 
valente: non tutte le formule di L, Set sono deducibili dagli assiomi formali). 
Sebbene il problema di determinare la non-contraddittorietà, in questa forma, 
sia un problema matematico relativo a successioni di oggetti combinatori co- 
struibili, esso risulta molto difficile. Una qualche argomentazione specifica a 
sostegno di questa non-contraddittorietà, tranne la fiducia nella validità dell’in- 
tuizione per la scelta del sistema di assiomi (confermata dallo sviluppo della 
matematica nel corso di alcuni decenni), non esiste ancora. D'altro lato, dal 
tempo dei primi lavori di Hilbert, è mutata notevolmente anche la valutazione 
dell’importanza di questi problemi. La non-contraddittorietà formale è solo un 
rozzo modello di alcune caratteristiche abbastanza sottili delle teorie mate- 
matiche significative, e si può realmente dubitare del valore gnoseologico delle 
deduzioni ottenute per simili modelli. Si tornerà su questo problema nell’ul- 
timo paragrafo di questo articolo. 

Un serio progresso si è raggiunto nel problema della deducibilità di varie 
classi di formule dagli assiomi di Zermelo-Fraenkel. Una pietra di paragone 
decennale per i metodi metateorici, in questo campo, è stata costituita dal pro- 
blema del continuo di Cantor (cfr. l’articolo « Applicazioni », $ 2, in questa stessa 
Enciclopedia). Recentemente è stato dimostrato che la formula IC nel linguag- 
gio L, Set, la quale è una traduzione dell’espressione «Esiste un insieme di 
potenza propriamente intermedia fra il numerabile e il continuo», non è dedu- 
cibile dagli assiomi di Zermelo-Fraenkel, come pure la negazione di questa 
formula (sotto la condizione che gli assiomi stessi di Zermelo-Fraenkel siano 
formalmente non-contraddittori). 

I metodi di dimostrazione dell’indipendenza di formule come IC dagli 
assiomi comprendono uno studio minuzioso delle diverse interpretazioni del 
linguaggio L, Set; qualcosa su ciò sarà detto nel $ 4. Soltanto in termini di 
queste interpretazioni si è cominciato a parlare di verità (piuttosto che deduci- 
bilità) nelle teorie formali degli insiemi, la quale, in tal modo, ha un carattere 
incomparabilmente più indeterminato e relativo che, ad esempio, la verità in 
aritmetica. Si può dire che le ricerche sull’ipotesi di Cantor abbiano esaurito il 
dubbio relativo al significato dell’impostazione stessa del problema della sua 
verità o falsità. Sebbene simili dubbi siano stati espressi nel corso di tutta la 
sua storia, il progresso consiste nel fatto che ora essi sono argomentati molto 
meglio; per questo motivo le obiezioni contrarie (ad esempio le proposte di 
nuovi assiomi della teoria degli insiemi) possono essere formulate in forma più 
concreta. La formalizzazione della vecchia intuizione ha detto, su questo pro- 
blema, la sua ultima parola. Ai sostenitori della teoria intuitiva degli insiemi oc- 
corre scegliere fra la necessità di sviluppare l’intuizione fino al punto in cui i 
problemi relativi all'assunzione di nuovi assiomi ricevano una soluzione unani- 
me (cosa poco probabile) e la possibilità che esistano sistemi alternativi per la 
teoria degli insiemi, che ammettano, in particolare, soluzioni diverse del pro- 
blema dell’infinito. 
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3. Matematica insiemistica. 


Quando si afferma che la matematica ha oggi, in larga parte, un carattere 
insiemistico, vengono tenute presenti alcune circostanze, connesse ma etero- 
genee. 

Prima di tutto la possibilità di tradurre nel linguaggio dei concetti della 
teoria degli insiemi e quindi nel linguaggio formale L, Set qualunque con- 
cetto, costruzione e affermazione relativa a sottoteorie matematiche diverse. 
Quindi la possibilità di ricondurre le dimostrazioni con metodi formali agli 
assiomi di Zermelo-Fraenkel (a volte completati da assiomi dell’infinito di un 
tipo più forte, ad esempio l’esistenza di ordinali inaccessibili; fra l’altro questi 
teoremi solitamente sono formulati come implicazioni). La dimostrazione di 
questa possibilità richiede un grosso lavoro nelle applicazioni all’analisi clas- 
sica, la «nuova matematica» stessa ormai si formula in termini insiemistici, 
senza però l’esplicazione costante del concetto di numero reale. Si vedano a 
questo riguardo gli Eléments de mathématique di Bourbaki e alcune osservazioni 
più avanti. . 

Fra le conseguenze a cui questa possibilità ha dato vita, la matematica ha in- 
dividuato un metodo - iniziato con l’aritmetizzazione dell’analisi — per supe- 
rare la separazione fra continuo e discreto. Rimuovendo l’originale contrappo- 
sizione intuitiva continuo/discreto per mezzo della riduzione di entrambi al- 
l'intuizione degli insiemi, la teoria degli insiemi ha poi permesso di costruire un 
immenso mondo gerarchico di strutture, manifestanti «gradi diversi » di con- 
tinuità, una struttura continua del discreto (le topologie m-adiche dei numeri 
interi), invarianti discreti del continuo (topologia algebrica e omotopia), ecc. 
(cfr. l'articolo «Continuo/discreto» in questa stessa Enciclopedia). 

In seguito l’ideologia insiemistica ha condotto a una diffusione di una spe- 
ciale forma estensionale di pensiero. Invece di descrizioni in termini di proprietà 
si assumono descrizioni in termini di insiemi di oggetti con date proprietà. I 
formalismi concreti sono scelti secondo la possibilità di eliminare la dipendenza 
dei nomi degli oggetti dalle scelte derivate (sistemi di coordinate, sistemi di nu- 
merazione, rappresentanti di classi di equivalenza, ecc.), è il principio di «scrit- 
tura invariante» dei matematici o «scrittura covariante» dei fisici. Tutte le pos- 
sibilità sono da ritenersi attualizzabili (ad esempio in alcuni calcoli di fisica 
teorica la dimensione dello spazio-tempo è considerata un qualunque numero 
complesso (!)). i 

L'esistenza va intesa nel senso più ampio della parola: non si presuppone 
né una dimostrazione di esistenza di un oggetto né la sua costruzione effettiva 
e neppure la sua esprimibilità in un linguaggio abbastanza povero. 

Esaminando più dettagliatamente il problema della traduzione delle diver- 
se «matematiche » nel linguaggio della teoria degli insiemi, si constata che pra- 
ticamente esso non si pone per quelle nuove discipline come la topologia o l’al- 
gebra astratta, che fin dall’inizio sono state formulate entro l'ambito insiemi- 
stico. Per questo ci si può limitare a una breve descrizione insiemistica «dei 
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numeri e delle figure», che costituiscono degli argomenti fondamentali della 
matematica classica, e alla considerazione dei problemi posti dall'uso del lin- 
guaggio delle categorie. 


3.1. Numeri naturali. 


Il modello standard dello zero nella teoria degli insiemi è l'insieme vuoto 
D; dell’unità {3}, del due {@, {©}}; in generale se l’insieme #, corrispon- 
dente al numero x, è già stato definito, allora (n+1)°=#U{#}. L'insieme # 
è un ordinale finito con x elementi: esso è totalmente ordinato dalla relazione € 
fra i suoi elementi (cfr. $ 4). L'esistenza di ciascun numero naturale è garan- 
tita dagli assiomi di Zermelo-Fraenkel, in particolare ZF3 e ZF6. In L, Set 
non è possibile scrivere i termini che li designano, ma si possono utilizzare 
espressioni approssimative, oppure estendere L, Set, come è stato spiegato nel 
$ 2. Poiché l’operazione 1+n+1 si esprime nel linguaggio della teoria degli 
insiemi, in questo stesso linguaggio si esprimono tutte le operazioni aritmetiche 
sui numeri naturali, grazie alla definizione induttiva dell’aritmetica di Peano. 
L'assioma di induzione è dimostrabile a partire dagli assiomi di Zermelo- 
Fraenkel. 


3.2. Numeri relativi e razionali. 


La riduzione classica dei numeri relativi ai naturali consiste nel conside- 
rare classi di equivalenza di coppie ordinate di numeri naturali in base alla 
relazione di equivalenza &m, n) > (m', n') se m+n' = m'+n; la classe della cop- 
pia <m, n) corrisponde al numero m—n. Questa classe, ovviamente, è un insie- 
me descrivibile con una formula di L, Set; essa può anche essere assunta come 
definizione del corrispondente numero relativo. Un lavoro abbastanza metico- 
loso è richiesto per definire le operazioni di somma e di moltiplicazione e per 
dimostrare le loro proprietà, ma in linea di principio è chiaro come ciò vada 
fatto (cfr. anche l’articolo «Calcolo», $ 3.1, in questa stessa Enciclopedia). 

Analogamente un numero razionale è costruito come una classe di coppie 
ordinate <a, b) di numeri interi, con b40, secondo la relazione di equivalenza 
<a, b> ><a', b'> se ab'=a'b, dopo di che si definiscono le leggi di composizione 
e la relazione d’ordine. 


3-3. Numeri reali R. 


Si possono costruire col procedimento di Dedekind (sezioni) o col metodo di 
Cantor (classi di equivalenza di successioni fondamentali di numeri razionali), 
i quali hanno un evidente carattere insiemistico e in tal modo sono anche presen- 
tati nei corsi istituzionali di analisi (una successione è una funzione dei numeri 
naturali nei razionali, oppure il suo grafico, vale a dire un insieme). 

Vale la pena di osservare che ad ogni gradino di questa scala di costruzioni 
gli oggetti costruiti al gradino precedente non s’identificano con gli oggetti 
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costruiti in seguito, ma si applicano soltanto canonicamente in essi, Se si de- 
sidera considerare che ogni numero naturale «sia » allo stesso tempo reale, cioè 
che gli corrisponda uno ed un solo insieme, alla fine della costruzione occorre 
cambiare la definizione di numero naturale. Allora, ad esempio, all’unità non 
corrisponderà l’ordinale {Z}, ma un insieme infinito «di successioni fonda- 
mentali di coppie ordinate di ordinali finiti» descrivibile con una formula ec- 
cezionalmente lunga di L, Set. 

In altri termini l’aritmetica si può immergere immediatamente nella teoria 
degli insiemi, oppure mediante l’analisi; i risultati saranno isomorfi, ma diversi. 
Con questo esempio sono chiari i motivi per cui le versioni insiemistiche di 
tutte le discipline matematiche non sono univoche. 


3.4. «Figure». 


È più facile immergere la classica geometria euclidea nella teoria degli in- 
siemi, identificando il piano euclideo, munito di un sistema di coordinate car- 
tesiane, con R?= R x R. Dopo aver stabilito la possibilità di esprimere la rela- 
zione di ordine e le operazioni standard di R in L, Set, è possibile sostituire la 
geometria euclidea con quella analitica, immersa nella teoria degli insiemi. 

L’assiomatica della geometria secondo Hilbert è ovviamente coerente nel- 
l'ottica della teoria degli insiemi. 

Anche le teorie geometriche contemporanee, che lavorano con spazi topo- 
logici, metrici, anellati, ecc., li immergono subito nel linguaggio insiemistico. 
Se inoltre si usano metriche riemanniane o modelli locali del tipo di spazi 
euclidei, allora la loro interpretazione insiemistica si riconduce direttamente 
all'interpretazione del continuo reale. 

Una posizione a parte occupa il linguaggio delle categorie, che diventa sem- 
pre più intuitivo e popolare (cfr. l'articolo « Applicazioni», $ 6, in questa stessa 
Enciclopedia). Come si è osservato in tale articolo, non esiste una formalizza- 
zione del linguaggio delle categorie che sia completamente indipendente dal 
linguaggio della teoria degli insiemi. D'altro lato l’interpretazione insiemistica 
di costruzioni categoriali realmente utilizzate s'imbatte in due difficoltà carat- 
teristiche. 

La prima è che non c’è ragione per considerare subito come insiemi gli og- 
getti e i morfismi di una categoria generale; essi hanno una natura indetermi- 
nata. In una intuizione insiemistica e in una formalizzazione adeguata occorre 
per questo prevedere degli «atomi» — gli oggetti, che non sono insiemi, ma la cui 
«collezione» costituisce un insieme. L’assiomatica originaria di Zermelo si ri- 
feriva esattamente a questo caso, ma sembra che non sia stata perseguita a 
sufficienza per ottenere tutte le deduzioni categoriali «intuitive». 

La seconda difficoltà, probabilmente legata alla prima, consiste nel deciso 
aumento del ruolo delle «classi» di Neumann-Géòdel-Bernays rispetto agli in- 
siemi abituali. 

In senso intuitivo una classe è una collezione arbitraria di insiemi, ad esem- 
pio «tutti» gli insiemi oppure «tutti» gli ordinali (per chiarimenti più precisi 
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sugli universi si veda il paragrafo successivo). Una classe, nel linguaggio for- 
male, si descrive con una «proprietà», o una formula avente una variabile li- 
bera. Intuitivamente le classi si distinguono dagli insiemi per il fatto che su 
esse non si possono eseguire le operazioni possibili sugli insiemi; in primo luogo 
una classe non può essere un elemento di un’altra classe o di un insieme (sono 
formalmente vietate le espressioni linguistiche di questo tipo). L'inosservanza 
di tale divieto conduce immediatamente in prossimità del paradosso di Russell. 

Fra l’altro le costruzioni categoriali più intuitive si riferiscono spesso € 
volentieri alle classi. Ad esempio la tipica costruzione del « gruppo K» di 
Grothendieck consiste in quanto segue. Si consideri il gruppo libero generato da 
classi [A] di gruppi abeliani finiti A, a meno di isomorfismi, e lo si quozienti 
rispetto al sottogruppo generato dalle relazioni [B]--[4]-[C] per tutte le se- 
quenze esatte 0o>+4-+B+C-o. Questo è il gruppo K;(FA5) per la categoria 
FAb dei gruppi abeliani finiti. I suoi elementi sono classi di classi; nelle as- 
siomatizzazioni standard della teoria degl’insiemi, simili costruzioni sono asso- 
lutamente proibite. 

Analoghi problemi fondazionali sorgono, ad esempio, nella realizzazione di 
costruzioni come lo «spazio classificante » di una categoria. In questa costruzio- 
ne, in maniera semplice, la categoria è paragonata a un grafo infinito i cui ver- 
tici sono oggetti e i cui lati sono i morfismi. Dopo ciò, alcuni cammini lungo le 
frecce di questo grafo, secondo regole determinate, s'incollano in simplessi a 
più dimensioni. I gruppi di omologia e di omotopia di questi spazi sono oggetti 
importanti, spesso già di tipo finito, ma i loro elementi sono ancora classi e 
classi di classi («gruppi d’ordine superiore K,»). 

La risposta ufficiale dei testi contemporanei, relativa alle difficoltà qui sol- 
levate, consiste nel presupporre che la categoria originaria sia « piccola», vale 
a dire che i suoi oggetti e i morfismi costituiscano un insieme, e non una classe, 
all’interno di un universo più ampio. Le difficoltà allora si riconducono al pro- 
blema dell’esistenza di una gerarchia di universi insiemistici con le proprietà 
necessarie (la gerarchia è necessaria per utilizzare liberamente in seguito gli 
invarianti calcolati, in nuove costruzioni) e al problema dell’indipendenza dei 
risultati delle costruzioni intuitive dalla scelta di questa gerarchia. Poiché molti 
di questi problemi sono probabilmente indecidibili, nello stesso senso, ad esem- 
pio, dell'ipotesi del continuo, essi sono semplicemente circondati dal silenzio 
[cfr. Artin, Grothendieck e Verdier 1963-64]. 


4. Problemi dell’infinito e modelli della teoria degli insiemi. 


In questo paragrafo sono descritti il concetto di universo e alcuni universi, 
utilizzati per dimostrare l’indecidibilità di problemi quali l’ipotesi del continuo. 
In termini semplici, un universo è una classe di insiemi nella quale sono verifi- 
cati tutti gli assiomi di una teoria assiomatica degli insiemi (nel nostro caso la 
teoria di Zermelo-Fraenkel); si chiama anche modello di questo sistema di 
assiomi. Se gli assiomi sono non-contraddittori, allora esistono molti universi 
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isomorfi; in alcuni di questi una data formula, ad esempio IC, può essere vera, 
in un altro falsa. In questo caso è indipendente dagli assiomi. 

Una descrizione logica più rigorosa deve essere formalizzata e il concetto 
di modello, in essenza, si riferisce a un’applicazione di due teorie formali l’una 
nell’altra. Si riporta una variante semiformalizzata, nella quale i modelli della 
teoria formale in L, Set saranno costituiti nella teoria intuitiva degli insiemi. 

Si comincia con la descrizione dell’universo che si può considerare come il 
modello standard della teoria di Zermelo-Fraenkel. 


4.1. Universo di Neumann-Zermelo-Fraenkel V. 


Primi stadi. L'universo V è costruito per induzione a partire dall'insieme 
vuoto, per successive applicazioni dell’operazione 9 (insieme delle parti). Pre- 


cisamente: V,=®, V,=9(D)={d} V.:=9(V)={2, {0} Va, 


RS è . x È È Ò 0 Pe 
=9(V,),... È facile vedere che V,CV,,41; lo stadio V, è costituito da 2 
(n-1 volte) insiemi finiti, i cui elementi sono insiemi finiti, «messi insieme» a 


partire da Z). Per uscire dai limiti degli insiemi finiti, si ponga V,,=UWYVa; 
b n=0 
dopo ciò si può iterare questa costruzione e porre V.,,+1=HV,) Vasa 
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Gli indici coi quali si numerano gli «stadi» di V sono gli ordinali di Cantor: 
insiemi totalmente ordinati a meno di isomorfismi. Prima di completare la 
descrizione, occorre dare gli elementi della teoria degli ordinali. 


Ordinali. Gli insiemi ordinati sono stati definiti nel $ 3 dell’articolo « Ap- 
plicazioni ». Sia (X, <) un insieme ordinato; esso è detto linearmente ordinato 
se per ogni Y,Ze X, con Y#Z, si ha Y<Z oppure Z< Y; si dice totalmente 
ordinato se, oltre a ciò, ogni sottoinsieme non vuoto di X ha un elemento 
minimo. 

Si dice isomorfismo degli insiemi ordinati X, X' un’applicazione biiettiva, 
strettamente crescente, fra loro. Si dice segmento iniziale dell'insieme total- 
mente ordinato X ogni sottoinsieme della forma Y={Y"|Y"<Y}, dove 
Ye X. I segmenti iniziali di X sono totalmente ordinati dalla relazione c in X. 

Il risultato fondamentale sugli insiemi totalmente ordinati afferma che se 
X e Y sono due di questi insiemi, allora o sono isomorfi, oppure uno di essi 
è iIsomorfo a un segmento iniziale dell’altro. Per il momento si chiami ordinale 
una classe di insiemi totalmente ordinati, a meno di isomorfismi. Ogni coppia 
di ordinali è legata da una delle relazioni x=}, a<8, B<a a seconda che i loro 
rappresentanti siano isomorfi come insiemi totalmente ordinati, oppure uno sia 
isomorfo a un segmento iniziale dell’altro. 

La formalizzazione del concetto di ordinale nel linguaggio L, Set si può 
realizzare comodamente seguendo Neumann. Secondo Neumann si chiama or- 
dinale un insieme X totalmente ordinato dalla relazione e fra i suoi elemen- 
ti e transitivo, vale a dire tale che da Ze Ye X segua Ze X. 
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Nel paragrafo successivo verranno identificati gli ordinali finiti con i nu- 
meri naturali. La classe di tutti gli ordinali è totalmente ordinata. L’ordinale 
minimo nella classe di tutti gli ordinali maggiori dia si indica con a+1 e si chia- 
ma successore di x. Nella definizione di Neumann a+1=aU fa}. L’ordinale 
8 si chiama limite se non esiste un ordinale a tale chea=B+1. Il primo ordinale 
limite © è isomorfo a {o, 1, 2, 3, ...}. Se f è un limite, nella definizione di 
Neumann 8=|J. 

a<B 

Tutti gli ordinali costituiscono una classe totalmente ordinata, ma non un 
insieme: altrimenti la loro unione sarèbbe l’ordinale pit grande, ma il seguente 
sarebbe ancora più grande [Burali-Forti 1896; Cantor 1895-97]. 

Gli ordinali sono utilizzati per tre scopi principali: per le dimostrazioni 
mediante induzione transfinita, per le costruzioni mediante recursione trans- 
finita e per le misure di potenza degli insiemi (cfr. «Applicazioni», $ 2). 

L’induzione transfinita si basa sul seguente principio: Za classe degli ordinali 
che contiene ZI, che accanto a ogni ordinale contiene il successore e che accanto a 
ogni insieme di ordinali contiene la sua unione, coincide con la classe di tutti gli 
ordinali. L’applicazione del principio di induzione transfinita in questa forma 
solitamente richiede una scelta preventiva di un ordinamento totale dei vari 
insiemi; la sua esistenza è stata dimostrata da Zermelo per mezzo dell’assioma 
di scelta. Nelle ricerche contemporanee, soprattutto di algebra, si preferisce di 
solito usare il cosiddetto lemma di Zorn, il quale fa a meno della necessità di que- 
sta scelta. 

Per le misure di potenza s’introduce il concetto di cardinale: si chiama cost 
un ordinale che non sia equipotente ad alcun ordinale inferiore. Tutti gli ordinali 
fino a @, compreso sono anche cardinali; ma ©wy+1, ©y+2 e molti ordinali suc- 
cessivi sono numerabili e per questo non sono cardinali. Ogni insieme è equi- 
potente a un unico cardinale e questi, in tal modo, costituiscono una scala di 
potenze naturale. 

Il primo cardinale maggiore di ©, si designa con ©;; il cardinale della po- 
tenza del continuo si denota con 2%; per questo l’ipotesi del continuo si può 
formulare come uguaglianza ©w,=2%. La classe di tutti i cardinali infiniti è 
totalmente ordinata e per questo è naturale numerarla mediante gli ordinali; 
se ©, è il cardinale relativo al numero «, allora l’espressione Wy41= 29% (poten- 
za di P(0,)) si dice ipotesi del continuo generalizzata. I problemi sulla verifi- 
cabilità di questo tipo di relazioni nell’aritmetica degli ordinali e dei cardinali, 
i problemi relativi ai cosiddetti cardinali inaccessibili e altri, formano la cer- 
chia dei problemi dell’infinito. Quelli a cui non è stata data una soluzione, co- 
me è noto oggi, sono formalmente indecidibili. Le loro correlazioni coi più 
tradizionali problemi matematici dell’analisi, della topologia o della teoria dei 
numeri sono comprese molto male. 


Conclusione della costruzione dell’universo. Per ogni ordinale B poniamo 
Ve=9(V), se B=a+1; eri B è limite, infine V=|\UY,. Questo è 
U< La 


l'universo, costruito per recursione transfinita. 


27 
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In particolare contiene tutti gli ordinali di Neumann: si può mostrare che 
aeV,g 

La formalizzazione della costruzione descritta sopra consiste di due passi 
fondamentali: la costruzione della formula di L, Set designante «Per ogni 
insieme x esiste un ordinale x con xe V,» e la deduzione di questa formula da- 
gli assiomi di Zermelo-Fraenkel. I fondamenti logici sono tali da considerare 
che V sia un modello di questi assiomi. Di conseguenza alcune considerazioni 
intuitive mostrano che V è chiuso rispetto alle abituali operazioni sugli insiemi: 
differenza, unione, intersezione, formazione di P(X) e di \UY, formazione di 

Yex 


{{(X)| Xe Y}, dove f è una funzione, formazione dei prodotti diretti, delle 
relazioni, delle applicazioni e delle immagini, ecc. 


4.2. Funzione di verità e modelli. 


Sia ora MCV una classe di insiemi, sia A l’alfabeto di L, Set, AC un 
insieme di simboli di variabile. Si dice M-specializzazione una qualunque ap- 
plicazione € di 4, in M, vale a dire la scelta, per ogni variabile xe Ap, di uno 
dei suoi valori xÈ, il quale è un insieme di M. Per induzione sulla lunghezza 
della formula P del linguaggio L, Set si definisce il valore della funzione di 
verità |P|y(&)=1 (vero) oppure |P|y(&)=0 (falso). Precisamente si ponga 
\xey]y(E)=1 se x8eyà; 0 se at €94; analogamente per le altre formule atomiche. 
Quindi si ponga |-P]y(E)=1-|Plu(È), IPA Ola (€) = Pla (6) [Ola (6), 
ecc., secondo le abituali regole della logica; infine si ponga |HxP|y(6)= 
= max|P|ar (€), |VxPiy (E) = min|P|y(E'), dove &' percorre tutte le M-spe- 
cializzazioni e si distingue da & solo per il valore della variabile x. 

La formula P si dice M-vera se |P|y(&)=1 per ogni È, e M-falsa se 
Ply (€É)= o per ogni É. Ogni formula chiusa è M-vera oppure M-falsa: il 
valore della sua funzione di verità non dipende da £. 

La classe M si dice modello dell'insieme di formule & (ad esempio di un 
sistema di assiomi), se tutte le formule a partire da & sono M-vere. Solitamente 
si considerano classi transitive, per le quali da Ye XeM segue Ye M. 

La formalizzazione del concetto di modello sostituisce il concetto di classe 
M col concetto di formula Q(x) con una variabile libera, la quale esprime M 
in L, Set, e la verità alla deducibilità dagli assiomi. 

Più in particolare, si definisce la Q-relativizzazione Pg della formula P del 
linguaggio L, Set per induzione sulla sua lunghezza. Per le formule atomiche: 
(xcy)9 è OGIAO(P)>x€y, (#=r)q è O4)AQ(9)>a=y. Quindi (—P)q è 
(Po); (P, * Po)e è (P.)a *(Po)g per ogni connettivo #;(VaP)g è Vx(0(x)>P) 
e (AxP)g è dx(0(x) AP). Una formula si dice transitiva se dagli assiomi è 
deducibile la formula O(x) A yex + O(9). 

La formula Q definisce un modello interno del sistema di assiomi se tutte 
le O-relativizzazioni degli assiomi sono deducibili da questi. Questo modello 
è transitivo se O è transitiva. 

Verranno ora descritti alcuni modelli che risolvono dei problemi dell’infinito. 
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4.3. Costruzione dell’universo di Gédel L. 


i Géodel definf una sottoclasse LC molto interessante: l’universo degli in- 
siemi costruibili. La sua più semplice definizione è la seguente: si tratta della 
più piccola sottoclasse di YY contenente tutti gli ordinali e che sia un modello 
per gli assiomi di Zermelo-Fraenkel. Tuttavia questo fatto si ottiene assai più 
tardi e come conseguenza di un’altra definizione intuitiva, la quale si usa anche 
nelle dimostrazioni. Per definirla, vanno introdotte prima le operazioni di Gi. 
del sui sottoinsiemi. Si tratta di tre operazioni binarie (formazione della cop. 
pia, differenza e prodotto diretto), due operazioni unarie (formazione dell’in- 
sieme dei primi elementi di tutte le coppie ordinate contenute in un dato in- 
sieme, e formazione del grafico di una relazione di inclusione nel quadrato di. 
retto di un dato insieme) e sei operazioni unarie (formazione dell’insieme delle 
terne ordinate, ottenute con una permutazione dalle terne ordinate contenute 
in un dato insieme). 

Più avanti s’indicherà con X la chiusura di qualunque insieme X: è il più 
piccolo insieme contenente tutti gli elementi di XY in maniera chiusa rispetto 
alle operazioni di Gédel. 

Ora la definizione effettiva di universo L è questa: L= UL, (unione rispetto 
agli ordinali x), dove Lo= 2, La:1= PLY) 0 (LU {La}, Le=ULa sc f 
a<B 


è definito. In altri termini ad ogni passo non si aggiungono tutti i sottoinsiemi 
dello stadio già costruito, ma solo quelli che si possono ottenere dagli insiemi 
a disposizione mediante le operazioni di Gédel. 

I primi stadi di L e di V coincidono: L,=V, per x<&p; tuttavia a partire 
da a= +1 l'inclusione L, CV, diventa propria. In effetti si può dimostrare 
che la potenza di L,, è uguale alla potenza «, già quando la potenza di V 


N . 3 . ‘4 ga 9 11 
è uguale a 2%», Da un punto di vista logico ciò non esclude la possibilità che 


Va4p(V, Lg), vale a dire L=V. 

| La proposizione L=V, più precisamente la sua traduzione formale nel 
linguaggio L, Set, si chiama «assioma di costruibilità». Ha uno status molto 
interessante. Gédel ha dimostrato che non contraddice gli assiomi di Zermelo- 
Fraenkel se questi stessi sono non-contraddittori, tuttavia sottolineò come non 
esista alcun fondamento per assumerlo «vero». Evidentemente egli era intui- 
tivamente convinto che in W si trovi una grande quantità di insiemi non co- 
struibili, di modo che l’assioma di costruibilità sarebbe falso. 

_ Gòdel dimostrò che dagli assiomi ZF1-ZFo9 e dall’assioma L= V è deduci- 
bile l'assioma di scelta ZFro. Intuitivamente ciò corrisponde alla possibilità 
di costruire in maniera ricorsiva una «funzione universale di scelta» per ogni 
classe L, la quale ponga in corrispondenza ad ogni insieme costruibile non 
vuoto un suo elemento e che sia essa stessa costruibile, 

n Infine Géòdel dimostrò che dagli assiomi ZF e dall’assioma L= V si deduce 
l'ipotesi del continuo generalizzata, che in tal modo non contraddice gli as- 
siomi di Zermelo-Fraenkel, se questi stessi sono non-contraddittori. La parte 
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«intuitiva» fondamentale di questa dimostrazione stabilisce che la potenza di 
P(W,)NL è 0,41, vale a dire i sottoinsiemi costruibili di un cardinale sono 
tanti quanto il cardinale successivo. Tuttavia se è «proprio» L#V, vi possono 
essere molti più sottoinsiemi. 

L'assunzione dell’assioma L= si può sostituire intuitivamente col cal- 
colo delle funzioni di L-verità per una serie di formule del linguaggio L, Set. 
Ciò permette di fare la dimostrazione di Gòdel in maniera meno sintattica, 

ma rimane comunque una lunga e difficile componente sintattica, connessa al 
l’effetto di «variazione di significato» delle formule del linguaggio formale nei 
modelli non standard. Si dimostrerà questo effetto sul cosiddetto «paradosso 
di Skolem», il quale è tecnicamente più semplice e fu scoperto prima del mo- 


dello di Gédel. 


4.4. Modelli numerabili e paradosso di Skolem. 


Sia M&V una sottoclasse di V. Stabilendo che M è un modello degli 
assiomi, si calcoli la funzione |P|y(&) per ogni assioma P, sapendo che 
|P|y(È)=1. Il concetto tecnico fondamentale risulta qui quello di formula 
assoluta: P si dice M-assoluta se per ogni M-specializzazione € si ha |P|y(6)= 
=|P|y(é). È chiaro che se la formula P è V-vera e M-assoluta, allora è anche 
M-vera, mentre quello di essere assoluta è un concetto «più sintattico» e per 
questo risulta più comodo verificarlo separatamente. Comunque ciò non è 
semplice come L=V se la formula non è scritta chiaramente, ma data sol- 
tanto con una complessa costruzione intuitiva. In ciò si trova la radice delle 
difficoltà sintattiche della dimostrazione di Gòdel. 

Il metodo universale per spezzare l’assolutezza è il seguente: se la formula 
O (x) contiene una variabile libera, allora Ax Q (x) può essere V-vera, in quanto 
in V si trova un insieme con la proprietà Q, ma non M-vera, poiché in M un 
simile insieme non si trova. i 

Per questo, per conservare l’assolutezza, ad esempio, di un insieme nume- 
rabile di formule di L, Set, può risultare necessario aggiungere un insieme 
per ogni formula vera Ux O (x) alla classe scelta originariamente MeV. Do- 
po ciò possono variare i valori delle funzioni di verità e di altre formule, ma 
l’iterazione di una quantità numerabile di simili passi è già sufficiente a garan- 
tire l’assolutezza della classe ampliata M2M,. . . 

In questo modo è possibile costruire un modello numerabile MCV degli 
assiomi di Zermelo-Fraenkel, a partire almeno da M;={W}. Per la verità 
questo può non essere transitivo: alcuni insiemi di M conterranno elementi 
non appartenenti a M. Ma, come ha dimostrato Mostowski, con un procedi- 
mento di eliminazione degli elementi «estranei» si può costruire un M, isomor- 
fo rispetto alla relazione €, che sia una sottoclasse transitiva di V, il quale, in 
tale modo, è un modello transitivo numerabile della teoria degli insiemi di 
Zermelo-Fraenkel. Si capisce che i principî descritti brevemente qui sono molto 
generali, e mutatis mutandis, si riferiscono ai modelli insiemistici di altri linguag- 
gi formali numerabili. 
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Verranno ora presentate alcune implicazioni dell’esistenza di modelli nu- 
merabili della teoria degli insiemi. 

Nel modello M c’è un insieme infinito x), come segue dalla M-verità del- 
l'assioma di infinità. In M c’è anche «l’insieme di tutte le M-parti di x,» 
9(x0)w in forza della verità dell’assioma di potenza. Sia xy sia P(xo)v non so- 
no più che numerabili, giacché il modello M è transitivo e numerabile. Per que- 
sto deve esistere un’applicazione di x, su P(x)y. Tuttavia anche il teorema 
di Cantor è deducibile dagli assiomi, vale a dire anche la formula «non esiste 
un'applicazione di x, su P(x,)» è M-vera. Questi fatti non si contraddicono 
l’un l’altro, né contraddicono il senso delle corrispondenti proposizioni in V, 
poiché P(x0)y =P(x)NM, e ciò rende P(x0)y, non più che numerabile, e poi- 
ché la M-verità del teorema di Cantor significa, «dal punto di vista di V», 
soltanto assenza di quelle applicazioni di x) su P(x0)y che sono a loro volta 
elementi di M. 

Per motivi storici si è preso a chiamare «paradosso di Skolem» tutti questi 
effetti di variazione di significato degli enunciati nei modelli, in particolare 
in quelli numerabili. Alcuni autori, fra cui lo stesso Skolem, pronti a lavorare 
con infinità numerabili, ma non superiori, consideravano questi effetti come una 
manifestazione di relatività dei concetti insiemistici, in particolare del continuo. 

Gli specialisti di analisi e di topologia, abituati a lavorare col continuo reale 
come con un qualsiasi formalismo della realtà, vedono nel paradosso di Skolem 
soltanto una manifestazione di inadeguatezza dei formalismi, in quanto metodi 
per imitare le considerazioni intuitive. Questa convinzione è sostenuta soltanto 
dall'esame di effetti analoghi nei modelli non standard del linguaggio dell’arit- 
metica, in cui l’intuitiva interpretazione standard appare alla maggior parte dei 
matematici assolutamente attendibile e univoca. 

In ogni caso, la costruzione di speciali modelli numerabili è un metodo po- 
tente per dimostrare l'indipendenza di diversi problemi di teoria degli in- 
siemi. Il metodo generale di costruzione di questi modelli, il forcing, fu sco- 
perto da Cohen. Lo si descrive però in un’altra variante, secondo Scott e So- 
lovay, i quali utilizzano considerazioni intuitive molto interessanti. 


4.5. Universo sopra un’algebra di Boole. 


Algebre di Boole. Sia S un insieme qualsiasi, B=(.S) l'insieme delle 
sue parti. In B si distinguono gli elementi G=0 e S=1; inoltre in B vi sono 
due operazioni binarie U e MN e una operazione unaria, il passaggio al comple- 
mento. Le operazioni U, N, ‘ sono legate da alcune identità, ad esempio 
(4Nb) =a'Ub' oppure 4N (6Uc)= (aNb)U(4Nc). L'insieme P(5) con que- 
ste operazioni e gli elementi distinti o, 1 è un’algebra di Boole. 

Piti in generale un insieme B con le operazioni A, V, ’ e con gli elementi 
distinti o, 1 si dice algebra di Boole se in esso è verificata ogni identità di un 
elenco finito (descritto nell'articolo «Dualità», $ 1, di questa stessa Enciclo- 
pedia). 


Sia ad esempio S uno spazio con misura p (cfr. l'articolo « Applicazioni », $ 3), 
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u(S)=1, BC9(S) sia l’algebra degli insiemi misurabili, B=B modo l’al- 
gebra delle classi di insiemi misurabili rispetto alla relazione di equivalenza 
«misura della differenza simmetrica uguale a zero». Allora B costituisce un’al- 
gebra di Boole; queste algebre svolgono un notevole ruolo nei modelli mate- 
matici della teoria delle probabilità. Ad esempio, rappresentazioni intuitive 
delle «grandezze casuali» sono ottenute col concetto matematico di funzione f 
sullo spazio S; la probabilità che la misura del valore della funzione f sia 
compresa fra a e b si ottiene dal numero u({xe S| a<f(x)<b}) (si suppone 
che tutte queste misure esistano, vale a dire che f sia una funzione misurabile). 

In analogia con questo esempio è comodo figurarsi che gli elementi dell’u- 
niverso, descritto più avanti, sull’algebra di Boole B, siano «insiemi casuali». 


Universo VB e «verità booleana ». Anche questo universo, come V, si co- 
struisce per stadi, numerati dagli ordinali: V8=\UVE. Per ogni coppia di 


x 

elementi X,Ye VB si definiscono induttivamente le «funzioni di verità a valori 
booleani» |Xe Y||eB e |X= Y||e B, che occorre rappresentarsi come «pro- 
babilità» di appartenenza di X a Y o di uguaglianza fra X e Y (nel consueto 
linguaggio delle probabilità le misure degli elementi dell'algebra B, e non gli 
elementi stessi, si dicono probabilità). Prima di descrivere esplicitamente la 
costruzione, dipendente solo da B, verrà indicato come la si utilizza nelle di- 
mostrazioni di indipendenza. 

Come prima, sia A, un insieme di simboli di variabile del linguaggio 
L, Set; si chiami VB-specializzazione £ un’applicazione di 4, in VF. Per ogni 
E e per ogni formula P del linguaggio L, Set è possibile definire il «valore di 
verità booleano» |P] (E) per induzione sulla lunghezza di P. Per le formule 
atomiche la definizione è esposta nella costruzione dell'universo V?: si tratta 
delle corrispondenti «probabilità». Quindi ||-P|= |P", |IPAOI=]P|AO], 
ecc. Questa associazione di valori di verità booleani agli enunciati è molto vi- 
cina alle idee originarie di Boole, uno dei fondatori della moderna logica formale. 

Si dice che la formula P è B-vera se ||P|(&)=1 per ogni &, e B-falsa se 
|P|(E)=0 per ogni &. Dal punto di vista delle probabilità una formula è B- 
vera se l’enunciato che le corrisponde risulta in ogni caso «vero con proba- 
bilità 1». 

Tutti gli assiomi logici del linguaggio L, Set sono B-veri per ragioni abba- 
stanza banali, già scoperte da Boole. I principî esposti nella costruzione di 
VB permettono di stabilire anche la B-verità di tutti gli assiomi di Zermelo- 
Fraenkel. Infine la B-verità si conserva per deduzioni a partire da formule 
B-vere. 

Per questo nella dimostrazione di non-deducibilità di una qualunque for- 
mula, ad esempio IC, a partire dagli assiomi, è sufficiente scegliere un’alge- 
bra B tale che |IC|}= 0. Anche questo si realizza col metodo di Cohen-Solovay 
che verrà descritto più avanti. 


AIA Ii 


) 
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Costruzione di VB. Si procede per recursione transfinita su x. Posto 
Usi =D; si supponga che per l’ordinale a sia già stato definito l’insieme W}; 
per ciascuno dei suoi elementi Xe V? sia definito un sottoinsieme D(X)C VE, 
per ogni coppia di elementi X, Ye V siano definite le «probabilità» | Xe Y||e 8, 
|xX= Y| e B. Si supponga inoltre che questi dati soddisfino le seguenti con- 
dizioni: se 8,<B,<a, allora Vj, CVf,; se B<a, Xe V2.,\VÉ, allora D(X) 
=V?. Infine si supponga che 


|xeri=v (IX=Z| AIZeY]) 
|X=Yl=( A_IZeXI VIZEYIA CA IZeY] vAZeX]). 
ZeD(X) ZeD(Y) 


E ora possibile definire tutti i dati necessari allo stadio VB,,= VEUVEI,. 
Precisamente V24, sarà costituito da tutte le funzioni possibili Z, con dominio 
di definizione V? e a valori in B, le quali soddisfano alla condizione di esten- 
sionalità: |X= Y| A Z(X)=|X=Y| A Z(Y) per ogni X, Ye VZ. Oltre a ciò 
per Ze VE, si ponga D(Z)=V e per le precedenti Z la definizione di (7) 
non cambia. 

Infine per gli ordinali limite } si ponga VETUTE. 

A< 


i Un ulteriore lavoro consiste nella verifica induttiva del fatto che le iden- 
tità per |Xe YI] e |X= Y] si conservano allo stadio x+1; ciò conclude di fatto 
la costruzione dell’universo VB=| UVB. 

x 


Si osservi che per formalizzare questa costruzione occorre considerare che 
BeV. Se B= (0,1) l'universo ottenuto sarà essenzialmente isomorfo a V, 
sebbene non coincida esattamente con esso. 


Verifica della «verità » degli assiomi. Nella costruzione dell'universo V£ è 
stata posta direttamente la condizione di B-verità dell'assioma di estensionalità. 
Le tre identità scritte sopra per la funzione di verità garantiscono la B-verità 
delle conseguenze di questo assioma: xey + Hz(x=% A zey); x=y è 
© (ex > zey) \(2€y + zex); (x=y) A (xe2) è (x=y) A (ye2) rispet- 
tivamente, dalle quali si deduce la sua B-verità. 

La possibilità di garantire ciò è ben lungi dall’essere evidente: cosa significa 
che «gli insiemi coincidono quando sono costituiti dagli stessi elementi», 
quando sia «insiemi coincidenti» sia «essere elementi» sono enunciati che 
possono essere veri soltanto con una certa probabilità? Qui i formalismi, sia il 
linguaggio stesso sia le sue interpretazioni a valori booleani, appaiono inva- 
rianti rispetto alla possibilità di «scrivere le idee sotto forma di calcoli». 

Tuttavia, dopo la verifica dell’assioma di estensionalità, quella dei rimanenti 
assiomi, anche se tecnicamente difficile, risulta un compito abbastanza diretto. 


l Scelta dell’algebra B che «confuta » l'ipotesi del continuo. È stato spiegato 
prima che la L-verità dell’ipotesi del continuo nella dimostrazione di Gòdel 
era garantita dall'assunzione di una «minore» quantità generale di insiemi, in 
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particolare dei sottoinsiemi di ogni cardinale, ottenibile considerando soltanto 
i sottoinsiemi costruibili. 

L'introduzione dell’algebra B produce l’effetto contrario: essa «aumenta» 
la quantità di insiemi, per tener conto della possibilità di variare le «proba- 
bilità» con cui un insieme è costituito dai suoi elementi. Questo approccio parti- 
colare permette anche di costruire, ad esempio, @y «B-sottoinsiemi» di cardi- 
nalità @,, scegliendo l’algebra B di potenza abbastanza grande. Tuttavia, come 
anche nella dimostrazione di Gédel o del paradosso di Skolem, con le B-inter- 
pretazioni si ottiene una variazione di significato di tutte le proposizioni, non 
necessariamente in senso vantaggioso. Per questo il controllo di tutti questi 
effetti richiede un lavoro ancora maggiore, i cui particolari verranno qui evitati. 

Si osservi per concludere che sono note anche diverse varianti di universo 
del tipo V8, nelle quali il ruolo di «base » non è svolto da algebre di Boole, ma 
da insiemi ordinati o in generale da «topos» di Grothendieck. Alcune di queste 
varianti si possono ritenere come la realizzazione delle idee della matematica 
intuizionista coi metodi della matematica classica. 


5. Critica e alternative. 


Per quanto siano cambiati storicamente il contenuto e la forma dei testi ma- 
tematici nel corso di due millenni, il loro carattere deduttivo rimane immu- 
tabile: «Dopo i Greci, chi dice matematica dice dimostrazione» [Bourbaki 
1954, p. 1]. Per questo ogni critica e ogni controcritica sui fondamenti, fra cui 
la teoria degli insiemi, procedono lungo due linee: la validità dei concetti e 
delle premesse iniziali e l'aspettativa delle deduzioni (compresi i metodi per 
ottenerle). 

Le argomentazioni riportate comportano invariabilmente un carattere non 
matematico. La validità della scelta dei concetti iniziali e delle regole d’analisi 
è verificata per confronto con una «realtà», vale a dire appellandosi al signifi- 
cato di un testo matematico. Perfino per la filosofia formalista della matematica 
è cost, giacché la scelta dei formalismi, in particolare situati entro la loro logica, 
e la loro metateoria sono fondati su considerazioni di contenuto. 

Tuttavia la categoria del significato del testo matematico, di per sé, è un’a- 
strazione d'ordine superiore. A uno studio più immediato si presentano i proce- 
dimenti di interpretazione del testo, che si assumeranno quale materiale origi- 
nario. In questi procedimenti si distinguono alcuni aspetti, che a loro volta si 
manifestano in diversi atti individuali di interpretazione. Li si descriverà e si 
proseguirà mostrando come l’assolutizzazione di uno qualsiasi di questi aspetti 
definisca ciascuna delle posizioni filosofiche adottate sui problemi dei fondamenti. 

L’uomo impara dall’infanzia l’interpretazione dei testi correnti nella lin- 
gua natale, parallelamente al possesso della stessa lingua, quando si trova in 
un ambiente linguistico omogeneo. In questo modo nella coscienza individuale 
si forma un nucleo rapido e univoco di testi comprensibili. Questa indivisibilità 
del processo di comprensione dei testi quotidiani permette di assegnarle la qua- 
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lità di significato determinato. Naturalmente quando questo processo di com- 
prensione diventa l’oggetto di studio di psicologi, linguisti, psichiatri, rivela una 
complessità enorme e una organizzazione gerarchica. Ma per gli scopi di que- 
sto articolo basta considerarlo come unitario e considerare il significato pro- 
dotto dall’interpretazione come un'autentica astrazione. 

Il problema si presenta assai più complesso con i linguaggi della scienza. 
Nella formazione di un abituale concetto delle scienze naturali, di un sistema di 
concetti o di una teoria, e anche nel loro studio, i testi corrispondenti presen- 
tano anche le istruzioni per la loro interpretazione. Queste istruzioni possono 
costituire una parte del testo ben delimitata, ma possono anche essere me- 
scolate in costruzioni linguistiche, parallele a costruzioni linguistiche di testi 
già interpretati. Come se si riuscisse a capire l’espressione « L’elettrone è passa- 
to oltre la fenditura A (e non la fenditura B)» nei manuali di meccanica quan- 
tistica, avendo come «istruzione» per l’interpretazione la sua sintassi, parallela 
alla sintassi della frase, comprensibile in maniera univoca, «Il sasso è passato 
oltre la fenditura A e non la B». Questa «istruzione» induce in errore e nu- 
merose spiegazioni seguenti sono dedicate all’introduzione della frase, ben for- 
mata nel linguaggio della meccanica quantistica, «Ampiezza di passaggio di 
un elettrone oltre la fenditura A», e alle istruzioni per interpretarla. Proprio 
alla fine di questa gerarchia di istruzioni si trovano solitamente le descrizioni 
dei procedimenti operativi delle scienze sperimentali: misurazioni, osserva- 
zioni, ecc. L’interpretazione di un testo comprende una, più o meno com- 
pleta, comprensione di questa gerarchia. 

. L’originalità dei testi matematici consiste solitamente nell’assenza di que- 
sti procedimenti operativi, ai quali il contenuto del testo si riferisce, magari in 
ultima analisi. Ciò nondimeno in determinate situazioni questo aspetto «rea- 
listico » svolge un ruolo fondamentale nell’interpretazione dei testi matematici. 

Inoltre, interpretando un testo matematico, il lettore utilizza forme visive, 
cinematiche e altré, più o meno determinate, che sorgono nella sua coscienza. 
L aspetto corrispondente del significato lo si chiama «interno». 

Finalmente il testo interpretato nelle sue relazioni con altri testi, reali o po- 
tenziali, vale a dire il costrutto delle sue traduzioni in altri sottolinguaggi, l’e- 
splicitazione di definizioni, le formalizzazioni, ecc., rivolgono il matematico 
verso l’aspetto «esterno» del significato. 

; Si consideri come semplice esempio l’interpretazione del concetto «due» 
nel contesti «prendi due mele», «dualismo filosofico» e «la sesta cifra dopo la 
virgola nello sviluppo decimale di x è due». Nel primo è più essenziale l'aspetto 
realistico del significato. Nel secondo, quello interno, giacché la rappresenta- 
zione di «due» deve applicarsi a un sistema concettuale tanto complesso quan- 
to «le essenze originali, giacenti a priori a fondamento del mondo, all’interno 
dei sistemi filosofici di una determinata classe». Infine nel terzo contesto domi- 
na il significato esterno, poiché la comprensione di questo testo fa appello 
alla ricostruzione di un certo metodo di calcolo approssimato, di un metodo per 
ottenere le cifre decimali della corrispondente approssimazione, di un metodo 
di valutazione della precisione, ecc. 
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Ecco ora una descrizione più dettagliata di questi aspetti del significato e 
della loro influenza sulla scelta e sulla valutazione dei diversi sistemi di fon- 


damenti della matematica. 


5.1, Aspetto realistico della semantica. 


Non v'è dubbio che svolga un ruolo fondamentale nella matematica «appli- 
cata», intesa in senso lato. Rientrano qui, in modo naturale, i calcoli ingegne- 
ristici ed economici. Si riferisce anche all'apparato della fisica teorica, seppure 
qui sia nettamente ingigantito il ruolo e la complessità dei procedimenti di espli- 
cazione del significato fisico dei calcoli. Per questo il rigore matematico-formale 
dei calcoli può passare, in fisica, in secondo piano, quando le regole d interpre- 
tazione costituiscono un fattore formativo più forte per la teoria. Una situazione 
come quella delle procedure di rinormalizzazione in elettrodinamica quanti- 
stica, che per la matematica appaiono come regole introdotte ad hoc nel testo 
formale, hanno un significato e una giustificazione definitiva nella coincidenza 
dei calcoli correttivi radiazionali con le misure sperimentali. La fisica costi- 
tuisce il più importante modello di pluralità d’interpretazioni realistiche della 
stessa teoria matematica: l'equazione delle onde può descrivere la vibrazione 
di una corda e la diffusione degli elettroni; un integrale può corrispondere a 
un volume, a una carica, a un percorso o a una probabilità; gli esempi si pos- 
sono moltiplicare senza fine. L’accentuazione di questa idea conduce a conce- 
zioni tanto diverse quanto il «convenzionalismo» di Poincaré, il ‘ relativismo 
insiemistico» di Skolem o l’interpretazione insiemistica della logica intuizio- 
nista. i l 

Per la matematica «pura» l’aspetto realistico del significato può essere do- 
minante, quando il testo è interpretato come la descrizione di un procedimento 
algoritmico, condotto sul testo stesso. Sono di questo tipo gli algoritmi elemen- 
tari con le frazioni decimali o le regole matematiche di sostituzione di un ter- 
mine in una formula. Infine il significato del programma per un calcolatore è 
quella successione di stati, prodotta dal calcolatore quando opera seguendo quel 
programma. Con un po’ d’esagerazione si può dire che il lavoro di un calcola- 
tore è anche uno dei procedimenti d’interpretazione del programma. 

La matematica egiziana e babilonese era quasi completamente « realistica » 
e tale è anche la semantica dei tradizionali manuali scolastici per le classi 
inferiori. . 

Occorre osservare che, nel nostro senso, la parola ‘realistico’ va interpretata 
in modo esteso. Perfino quando la sua interpretazione si effettua in termini di 
procedimenti empirici, vengono sottintese in realtà certe astrazioni, spesso di 
livello molto elevato. Queste astrazioni possono riferirsi non solo alle scienze 
naturali, ma anche alla filosofia: il presupposto che esista un mondo «neopla- 
tonico» degli insiemi permette di annoverare nella filosofia « realistica » la clas- 
sica matematica insiemistica. La negazione di questo mondo, in quanto non 
reale, e la sua sostituzione col più reale mondo dei testi e dei procedimenti al- 
gebrici su di essi, caratterizza «l’altro realismo», quello della matematica co- 
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struttiva. L'orientamento sulla realtà del mondo fisico e l’interpretazione del- 
la matematica in termini di scienze naturali predetermina la filosofia «appli- 
cata» della matematica, a stento formulata sistematicamente ma creata quoti- 
dianamente dai fisici. 


5.2. Aspetto interno della semantica. 


Come si è detto, si manifesta in ogni atto individuale d’interpretazione e 
anche nel compito di esplicare il «significato intuitivo del testo», dipendente 
dalla coscienza individuale. 

Ogni persona ha accesso immediato solo alla propria coscienza. L’auto- 
osservazione e i metodi linguistici permettono di formare un modello esterno 
dei propri atti cognitivi, anche se del tutto inadeguato e incompleto. Inoltre 
la componente inconscia fondamentale esce completamente dalla descrizione, 
oppure si deforma a seguito dei tentativi di esteriorizzarla. 

Per questo le descrizioni esistenti del significato intuitivo dei testi si riferi- 
scono abitualmente a concetti separati e ad atti cognitivi elementari. Oltre ai 
filosofi e agli psicologi, hanno formato dei modelli notevoli di tali descrizioni 
Pascal, Poincaré, Hadamard. La struttura anatomica e funzionale del sistema 
nervoso centrale, comune a tutti gli uomini, da un lato, e dall’altro, le comuni 
esperienze e consuetudini linguistiche, permettono di isolare una totalità di 
unità espressive elementari per «il linguaggio dei significati intuitivi». Fra 
queste possono rientrare termini paramatematici come ‘quantità’, ‘vicinanza’, 
a un livello più alto ‘relazione’, ‘continuo/discreto’, a un livello ancora superiore 
‘algoritmo’. In qualità di unità espressive possono agire anche disegni sche- 
matici. 

L'assegnazione dello status di termine di un sottosistema assiomatizzato 
della matematica porta il concetto intuitivo dal livello di «semantica interna» 
al livello di «semantica esterna». Inoltre la precisione del significato procede 
per mezzo dell’eliminazione di possibilità, in potenza racchiuse nel modello 
intuitivo. Cosi il concetto intuitivo di «grandezza attuale infinitamente piccola » 
fu completamente eliminato nei fondamenti classici dell'analisi e comparve nei 
concetti precisi di «elemento nilpotente» della geometria algebrica e della geo- 
metria differenziale dei nostri tempi, e di «infinitesimo » nei modelli non-stan- 
dard dei numeri reali da parte dei logici. Conservando alcuni tratti dell’arche- 
tipo intuitivo, queste interpretazioni «esterne» delle grandezze infinitamente 
piccole non coincidono e portano in direzioni diverse. 

La totalità delle unità del significato interno è individualmente e storica- 
mente variabile, aperta e debolmente strutturata. La conquista di nuovo mate- 
riale porta alla formazione di nuove unità. 

Ad esempio la mutua interazione fra le particelle elementari e col campo, 
può essere descritta in fisica nel linguaggio dei «grafi di Feynmann». Ciascuno 
di questi grafi «è » una configurazione di punti di vario genere, uniti da lince-lati 
di vario genere. Interpretando «realisticamente» un dato grafo, un fisico vede 
in parte della sua struttura le linee universali delle particelle elementari. Un’al- 
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tra parte della struttura, che non ammette questa interpretazione, sarà parago- 
nata a particelle «virtuali». Cosi sorge una nuova, comoda, unità di significato 
intuitivo, rispondente ai fatti osservati, ma intermedia rispetto alle unità espres- 
sive del linguaggio accettato. In modo analogo sono sorti i quark, corrispon- 
denti alle rappresentazioni irriducibili di un certo gruppo. Il problema dell’«esi- 
stenza reale» di particelle virtuali o di quark necessita di una sottile interpre- 
tazione, prima che si tenti di risolverlo. 

Si osservi infine che l’interpretazione «esterna» del grafo di Feynmann 
presuppone, ad esempio, la capacità di scrivere un termine che gli corrisponde 
nella teoria delle perturbazioni, e l’interpretazione «esterna» dei quark, la ca- 
pacità di decomporre un prodotto tensoriale di due rappresentazioni nella som- 
ma delle loro componenti irriducibili. 

Ogni concezione coerente dei fondamenti della matematica tende a limitare 
al minimo necessario la base di unità di significato intuitivo che viene adottata. 
Si producono con.ciò una scelta di unità espressive accettabili e una limita- 
zione nella dimensione del loro contenuto intuitivo, dopo di che le rimanenti 
unità da assumere sono strutturate per mezzo di quelle elementari. 

L’accettazione del linguaggio della teoria degli insiemi, preparato dall’«arit- 
metizzazione del continuo», ha in effetti permesso di diminuire notevolmente 
il campo delle unità elementari del significato «interno» 0, secondo Bourbaki, 
«delle varie intuizioni», necessario alla matematica, senza diminuire il volume 
della matematica classica. Dopo aver imparato l’interpretazione intuitiva dei 
concetti e delle costruzioni insiemistiche, il matematico poté cessare di rivolger- 
si all’intuizione come all’unica fonte di molti altri concetti. Ad esempio la 
«curva» diventava complessa, ma rientrava in modo inequivocabile nei costrutti 
insiemistici. 

Il successivo approfondimento di questo concetto poté scoprire proprietà 
«intuitivamente evidenti» in precedenza, o anche del tutto nuove, come l’esi- 
stenza della curva di Peano, che riempie un quadrato, la quale appariva netta- 
mente contraria all’intuizione (Poincaré). La teoria degli insiemi ha salvato la 
maggior parte dei matematici dall’anarchia della diversità delle intuizioni in- 
dividuali, lasciando per la verità questo fardello a una minoranza, che tenta di 
ottenere una spiegazione intuitiva e un accordo sul significato interno dell’unico 
fondamentale concetto di insieme, che inizialmente era cosi intuitivo. 

Si considerino da questo punto di vista alcune alternative al linguaggio 
della teoria degli insiemi. La prima è il linguaggio duale delle «proprietà», dei 
«predicati », ecc. Il suo enunciato elementare, «avere una proprietà», sostituisce 
l’enunciato «appartenere a un insieme». La semantica del concetto di proprie- 
tà, assunto come iniziale, non è intuitivamente obbligata ad essere completa- 
mente equivalente alla semantica del concetto «insieme di elementi con una 
data proprietà», almeno per il fatto che la determinatezza del concetto «essere 
rosso » non richiede affatto la determinatezza « dell'insieme degli oggetti rossi», 
che tenga conto almeno della presenza di una scala di sfumature di colore. 
Oltre a ciò, nella matematica precedente a Cantor, il linguaggio delle pro- 
prietà era usato proprio per sostituire l’infinità attuale, diventata un tabù. In 
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effetti, intuitivamente, la «verifica del fatto che un oggetto possiede una data 
proprietà» si distingue nettamente dalla «raccolta di tutti gli oggetti con quella 
data proprietà». 

Ciò nondimeno, nei sistemi di Russell-Whitehead, di Quine e di altri autori, 
la formalizzazione del linguaggio delle proprietà nella «teoria dei tipi» era usata 
precisamente per fondare la teoria degli insiemi. Lo scopo pragmatico consiste- 
va in una limitazione dell’universo e dei metodi linguistici, tale da rendere im- 
possibile la presenza di paradossi del tipo di quello di Russell. 

Per la teoria dei tipi la «realtà» è l'universo, costituito da individui (di tipo 
zero), loro proprietà (di primo tipo), proprietà delle loro proprietà (di secondo 
tipo) e cosi via senza fine. Il paradosso di Russell non può verificarsi poiché la 
proprietà «essere una proprietà, non posseduta da se stessa» non appartiene al- 
l'universo. 

Tuttavia in questo universo non è comodo interpretare la matematica clas- 
sica, già al livello del linguaggio, ed è quasi impossibile al livello degli assiomi 
di esistenza: l'assioma di «riducibilità » introdotto da Russell non risulta sod- 
disfacente. 

Varianti della teoria dei tipi sono connesse alla tesi «logicista», secondo la 
quale la matematica è riducibile alla logica, per motivi storici e intuitivi; que- 
sta tesi stessa possiede un contenuto appena percettibile. 

Nella matematica intuizionista, il posto sia di «insieme» che di «proprietà » 
è occupato all’incirca dall’enunciato «legge di formazione ». Tuttavia l’assunzio- 
ne fondamentale dell’intuizionismo, relativa alla non-essenzialità del «signifi- 
cato esterno» dei loro testi, in particolare all’inadeguatezza di qualunque loro 
formalismo, non consente di portare molto avanti questo confronto. 

Per Brouwer e la sua scuola intuizionista l’oggetto dell’intuizione origi- 
naria è la serie dei numeri interi o, 1, 2, 3, ..., inoltre considerata non come 
realizzata, ma in divenire per mezzo della legge di passaggio da n ad n+1. 
Di conseguenza l’induzione è assunta come il modello fondamentale di tutte 
le costruzioni accettabili in matematica. Di per sé le costruzioni devono essere 
realizzate con metodi finitistici a partire da oggetti finiti e l’esistenza di un og- 
getto matematico è intesa come la possibilità di costruirlo. Ciò esclude le di- 
mostrazioni di esistenza «per assurdo», non accompagnate da una rappresen- 
tazione dell’oggetto corrispondente, nei casi in cui occorra sceglierlo in un in- 
sieme potenzialmente infinito. È questo il noto principio di inaccettabilità della 
legge del terzo escluso nei domini infiniti. 

Il continuo di Brouwer è difficilmente esplicabile nei termini classici di 
«immediato divenire libero», ad esempio delle frazioni decimali, non attual- 
mente, ma solo potenzialmente infinite; nello stesso tempo, tuttavia, la scelta 
delle successive cifre decimali non è sottoposta ad alcuna legge. 

Kronecker fu il primo predicatore delle limitazioni che questo punto di 
vista pone alla matematica, e uno dei più influenti avversari di Cantor. Brou- 
wer e i suoi successori dedicarono molti sforzi al chiarimento dei limiti della 
matematica e della logica intuizioniste, sviluppando i loro principî positivi. 
Tuttavia essi, in particolare Heyting, sottolineavano costantemente il primato 
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dell’interpretazione interna dei testi matematici e le limitate possibilità di tra- 
smetterla in teorie assiomatiche intese in modo univoco. Con queste posizioni 
filosofiche, la mancanza di preparazione ad accogliere l’interpretazione interna 
della teoria degli insiemi nello spirito di Cantor può risultare infondata: molti 
matematici accettano nel suo complesso l’interpretazione interna della teoria 
degli insiemi. Per le motivazioni gli intuizionisti si appellano ad argomenti 
psicologici a difesa del primato dell’idea di suddivisibilità, discontinuità e, 
pare, numerabilità potenziale quale unico tipo legittimo di infinità. Agli intui- 
zionisti non sono estranei gli appelli al significato « realistico » della matematica; 
in uno dei suoi articoli Brouwer afferma che l'applicazione del principio del 
terzo escluso nelle scienze naturali dipende dalle proprietà di finitezza e discre- 
tezza del mondo fisico. : 

Il costruttivismo della scuola di Markov cominciò a costituirsi alla fine 
degli anni ’40, come variante dell’intuizionismo, mediante l’utilizzazione del 
concetto di oggetto costruibile e algoritmo, precisato in base alla teoria delle fun- 
zioni ricorsive o di qualche sua variante. Senza entrare qui nei particolari delle 
definizioni, verranno indicate soltanto alcune posizioni fondamentali di questa 
scuola. 

La «realtà» dei costruttivisti è data dai testi su alfabeti finiti, sottoposti a 
processi di elaborazione che sono algoritmici, in particolare anch'essi descritti 
su un alfabeto finito. 

L’infinità potenziale è ammessa come astrazione di testi, a priori di lun- 
ghezza non limitata, e di algoritmi che lavorano per un tempo a priori non li- 
mitato; l’infinità attuale viene rifiutata. 

L’esistenza di un oggetto matematico è trattata come la sua esibizione, op- 
pure come la possibilità di costruirlo algoritmicamente. La sottigliezza essenzia- 
le consiste nel fatto che, secondo Markov, la possibilità di costruzione algorit- 
mica di per sé può essere stabilita con metodi classici e non ottenuta esclusiva- 
mente esibendo questa costruzione. In particolare in queste dimostrazioni si 
può utilizzare la riduzione all’assurdo. 

Il continuo costruttivo è rappresentato da una coppia di algoritmi, il primo 
dei quali fornisce la successione numerabile di Cauchy dei numeri razionali, 
mentre il secondo fornisce chiare valutazioni sulla velocità del suo andamento 
(in senso classico). Perciò, dal punto di vista della matematica classica, è nume- 
rabile; oltre a ciò, 4) la proprietà della coppia di algoritmi di definire un numero 
reale è algoritmicamente non decidibile, d) la proprietà di due di questi algorit- 
mi di definire lo stesso numero non è decidibile; cosi pure non è decidibile la 
proprietà di rappresentare un dato numero. Per questi motivi l’analisi costrut- 
tiva si distingue nettamente da quella consueta. Ad esempio, al posto delle 
funzioni di variabile reale si considerano gli algoritmi che trasformano un nu- 
mero reale costruttivo in un altro numero del genere. Ma allora una semplice 
funzione quale sgnx(= —1 per x<0, =0 per x=0, =+1 per x>o) non 
esiste nell’analisi costruttiva, perché altrimenti sarebbe risolubile la proprietà 
di un numero di «essere zero». In effetti tutte le funzioni costruttive sono con- 
tinue nel senso classico della parola. 
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Quella «realtà» con la quale la matematica classica confronta le proprie 
costruzioni, per la maggioranza appare come una specie di «realtà » neoplato- 
nica del mondo delle idee. Dal punto di vista del materialismo filosofico, si 
tratta della realtà delle coscienze individuali che riflettono il mondo esterno, 
sublimata ed estetizzata; dal punto di vista del platonismo, la realtà è indipen- 
dente dalle coscienze e si trova con queste in un accordo predisposto. È possi- 
bile anche considerare questo mondo come la parte comune alle proiezioni 
verso l’esterno dei significati interni della matematica nelle coscienze indivi- 
duali. Una rappresentazione di unità di questo mondo può sussistere finché 
la voce discorde di eminenti matematici non dimostri il contrario. 

È difficile tuttavia che qualsiasi argomento sulla semantica del concetto di 
insieme in matematica possa ritenersi definitivo. Una sua analisi attenta mostra 
un’estrema povertà del materiale scientifico riportato. 

Ad esempio, criticando l’infinità attuale di Cantor delle essenze distingui- 
bili, dalla posizione «realistica», si potrebbe osservare che essa non assolutizza 
tanto l’esperienza di uso del finito, quanto la fisica quotidiana in senso corrente, 
per la quale il mondo consiste di cose separate, che si possono contare, ordi- 
nare, riunire, ecc. La fisica quantistica suggerisce allora astrazioni del mondo 
di un tipo completamente diverso, nel quale un «insieme» di elettroni, ad esem- 
pio, consiste di essenze diverse ma non separabili; nel quale la logica non ri- 
flette la logica del discorso comune, orientato verso il macromondo, ma non 
coincide con la logica dell’intuizionismo, e in generale con nessuna delle ver- 
sioni proposte dai filosofi della matematica. L’infinità del micromondo è «in- 
terna» ed «estesa», coi suoi aspetti probabilistici e relativi ai campi, assoluta- 
mente dissimile da quella di Cantor e definitivamente non riducibile a una 
successione di «atti elementari di suddivisione»; è la stessa cosa considerarla 
attuale piuttosto che potenziale. Il predicato stesso «appartenere a» ha nel mi- 
cromondo uno status dubbio. 

D'altro lato, anche le considerazioni psicologiche di Brouwer, Heyting e 
altri si richiamano soprattutto all’autoosservazione elementare e non prendono 
affatto in considerazione i risultati della psicologia scientifica e della neurofisio- 
logia. Si può dire che un’attenta osservazione agli aspetti costruttivi. della mate- 
matica ha permesso di isolare il concetto di macchina di Turing universale co- 
me « minimo denominatore » di tutte le coscienze individuali. Il suo fondamento 
fisiologico è l’attività discreta di movimento che utilizza i più semplici recettori, 
ad esempio, tattili. 

L’infinità potenzialmente numerabile degli intuizionisti e dei costruttivisti 
è un'infinità accessibile a questo denominatore. Tuttavia l’intuizione geome- 
trica, sulla quale è fondata l’infinità del continuo, viene completamente igno- 
rata in questo approccio. Il suo fondamento fisiologico è l’attività di movimento 
dello stesso piano ampliato, che si basa sui procedimenti complessi di elabora- 
zione dell’informazione per mezzo di recettori visivi e di corrispondenti zone 
corticali. La descrizione neurofisiologica di questi procedimenti è appena al- 
l’inizio, ma è del tutto chiaro che concezioni semplificatrici dell’intuizione ma- 
tematica, proposte a scopo polemico, sono lontane dalla realtà. 
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5.3. Aspetto esterno della semantica. 


È complementare all’aspetto interno, nello stesso senso in cui la descrizione 
delle regole d’uso della parola ‘insieme’ è complementare alla sua definizione 
secondo Cantor. Concependo il testo matematico come un modello «esterno», 
il matematico può costruire le sue traduzioni in altri sottolinguaggi (dalle for- 
mule ai grafici e viceversa), costituire diverse abbreviazioni del testo 0, al con- 
trario, ricostruire passaggi saltati nelle dimostrazioni; sperimentare variazioni 
delle premesse; ecc. Il «significato esterno» di un testo matematico è il suo si- 
gnificato d’uso per il matematico di professione, quando scrive un articolo, in- 
segna la matematica agli studenti o comunica coi colleghi. Il procedimento di 
interpretazione esterna non è obbligato, e raramente ciò accade, ad essere un’in- 
formazione completa, precisa, lineare sui concetti fondamentali (cosi è solo il 
suo modello nella teoria formale). Esso contiene tortuosità, strade senza sboc- 
co e ostacoli. L’interpretazione della retta euclidea come modello dei numeri 
reali, e dei numeri reali come insieme dei punti della retta, non definisce nessu- 
no di questi concetti, ma chiarisce il significato di entrambi. 

L’interpretazione «realistica» della funzione delta di Dirac (3 (x)=0 per 
x370, d(0)= co, {d(x) dx=1), ad esempio, per un fisico, è quella di una mas- 
sa puntuale con densità infinita. Per un matematico una variante più astratta 
di questa rappresentazione si rivolgerà piuttosto alla categoria della semantica 
«interna». Soltanto con la possibilità di concepire la funzione delta in maniera 
«esterna», come funzionale sullo spazio delle funzioni a supporto compatto 
e racchiuderla in tal modo nei formalismi dell’analisi, in quanto termine ben 
definito, e nelle teorie matematiche generali in quanto autentico oggetto insie- 
mistico, il matematico si sente completamente tranquillo. Tuttavia il fisico può 
ritenersi completamente soddisfatto dal formalismo esterno, in questo caso, 
senza postulare affatto la sua riducibilità alla teoria degli insiemi. l 

La componente filosofica delle concezioni formalistiche della matematica 
è connessa proprio con l’assolutizzazione del suo aspetto esterno, quando il 
contenuto viene completamente identificato con la forma. Con la cristallizza- 
zione della matematica formale nei lavori di Hilbert e della sua scuola, si è di 
nuovo legati alle difficoltà della teoria degli insiemi. 

Lo spirito innovatore di Cantor si è espresso prima di tutto nella forma- 
zione di una teoria intuitiva degli «ordini di infinità». Dal punto di vista lin- 
guistico ciò ha significato la confusa introduzione di alcuni assiomi di esistenza 
degli insiemi (fra cui l’assioma sull'insieme delle parti e l'assioma di scelta), 
l’utilizzazione di costruzioni linguistiche di nuovo tipo (come la definizione di 
ordinabilità totale) e, infine, la libera applicazione della logica del finito nel nuo- 
vo mondo infinitario (in particolare la legge del terzo escluso). 

Questa valutazione del lavoro di Cantor, come si intende, si è resa possibile 
solo a posteriori; per esso, e per molto tempo dopo di esso, al primo posto si è 
situata la semantica dell’infinità attuale di tipo neoplatonico, anche se, proba- 
bilmente, non portata fino in fondo. In ogni caso, le affermazioni e i problemi 
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sull'esistenza dei vari insiemi furono intesi come aventi un significato comune 
a tutti. Gli stessi insiemi, di cui si affermava l’esistenza, potevano essere asse- 
gnati indicando le proprietà del loro elemento generico o costruendoli a partire 
da qualche insieme già dato. 

Il trasferimento dell’accento dal « significato » al «testo» fu richiamato pro- 
prio dalla critica di questa semantica, sia dalla scoperta di paradossi, sia dal- 
l’inaccettabilità intuitiva per molti del teorema di Zermelo sulla possibilità di 
ordinare totalmente qualunque insieme. Il punto di vista di Hilbert consisteva 
nel fatto che non tutti i concetti e le considerazioni matematiche debbano essere 
immediatamente interpretabili in termini finitistici. Quelle che non ammettono 
una simile interpretazione sono costruzioni linguistiche «ideali», che sono ag- 
giunte al sistema per semplificare le dimostrazioni dei teoremi, standardizzare il 
linguaggio, ecc. La loro ammissione nel sistema, tuttavia, richiede il rispetto 
di determinate regole, la principale delle quali è la non-contraddittorietà del si- 
stema. La non-contraddittorietà deve essere garantita inizialmente per mezzo di 
un’accurata ricerca sulla sintassi del linguaggio, la quale deve essere condot- 
ta senza fare ricorso all’infinità attuale. Il suo risultato principale fu la varietà 
dei modelli formali di logica e di matematica sorti in conseguenza di questo pro- 
gramma. In particolare la costituzione dei concetti matematici precisi di nu- 
merabilità e di algoritmo e di tutta la teoria delle funzioni ricorsive è strettamen- 
te legata al programma di Hilbert. L’impossibilità di realizzarlo nella sua tota- 
lità, scoperta da Gédel, costituisce un altro aspetto del problema. È difficile 
decidere se questa impossibilità confermi l'accettazione della teoria intuitiva 
degli insiemi, come la si conosce oggi, oppure la sua negazione; con gli stessi 
fondamenti, questa domanda si può già porre per l’aritmetica. 

In ogni caso, la visione della matematica come di un sistema formale è 
molto produttiva, quando se ne comprendono le limitazioni. Essa dà la possi- 
bilità di ottenere una notevole comprensione reciproca nell’esame di concezioni 
cosî diverse quali la logica intuizionista e la fisica teorica, fornendo gli «schemi 
svuotati» dalle strutture complesse. La non-contraddittorietà di un sistema for- 
male, la cui utilità è verificata sperimentalmente, cessa di essere il compito pri- 
mario. La scelta di testi concretamente generati nel sistema, costituenti una 
parte assolutamente insignificante di tutti i testi ammissibili, si esegue comun- 
que secondo regole non formalizzate che sono più importanti della non-contrad- 
dittorietà formale, descritta nei termini di tutti i testi sottoposti a generazione. 
Il ruolo dei testi scelti è quello fondamentale, sebbene poco studiato, di mediare 
fra un cervello e un altro, fra un cervello e il mondo esterno come pure fra un 
cervello e se stesso (il testo è una memoria esterna; il testo getta un ponte fra 
l'intuizione geometrica e quella aritmetica di ciascuna coscienza individuale, 
intuizioni che si basano su differenti meccanismi fisiologici). In ultima analisi, 
l'aspetto principale del testo è la sua possibilità di partecipare a questi atti di 
mediazione, e solo lo studio di questa possibilità può risolvere l'enigma della 
matematica. La vecchia metafora di Victor Hugo che paragona un libro e una 
cattedrale ha un significato profondo se la strutturabilità del testo costituisce 
la premessa più importante del suo ruolo sociale. 
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Tutti questi problemi contribuiscono all’umanizzazione della matematica; 
insieme al movimento di matematizzazione della conoscenza umanistica, essi 
aiutano a ritrovare l’unità perduta delle due culture. Con una previsione sin- 
tetica, ci si può attendere una nuova concezione di «insieme» come uno dei pit 
eccezionali miti del nostro tempo. [JU. I. M.]. 
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Fin dai suoi inizi la teoria degli insiemi si è posta come un elemento unificante a un li- 
vello di grande generalità per le diverse discipline matematiche (cfr. calcolo, geo- 
metria e topologia, dualità) e, attraverso una profonda crisi fondazionale, ha determina- 
to il sorgere di diverse scuole e tendenze, relative ai problemi della verità in matematica, 
della dimostrabilità, dell’infinito e dell’infinitesimale (cfr. anche vero/falso, verifica- 
bilità/falsificabilità). 

Oggigiorno il pensiero insiemistico è penetrato all’interno di tutta la scienza grazie 
alla creazione di formalismi efficienti (cfr. anche fisica, forza/campo, energia) e, posta 
attenzione alla definizione formale per non cadere in uno dei frequenti (e proficui) para- 
dossi che ne hanno caratterizzato lo sviluppo, la nozione generale di insieme rappresenta 
il fondamento logico sul quale si eseguono le costruzioni e si conducono le dimostrazioni 
rigorose di maggior parte della matematica (cfr. logica, assioma/postulato; deduzione/ 
prova). 

Accanto alla concezione formale della teoria degli insiemi, dal purito di vista del con- 
tenuto, si scopre che in molti casi lo studio generale di una disciplina matematica si risolve 
nello studio di insiemi dotati di struttura e delle loro proprietà invarianti rispetto alle ap- 
plicazioni compatibili con questa struttura (cfr. perciò strutture matematiche, appli- 
cazioni, funzioni, invariante, variazione, continuo/discreto, simmetria). 


602 


X) finito. Questa li- 
vo (cfr. qualità/ 

» la grandezza 

a un profilo 
‘malitiche 

olice/ 

culla 


N 


Razionale/algebrico/trascendente 


1. Introduzione. 


1.1, I termini del discorso. 


I termini nel titolo di questo articolo si applicano in primo luogo ai numeri 
e alle funzioni. 

Si dice numero razionale il rapporto fra due numeri interi, cioè un numero 
commensurabile con l’unità. Si dice funzione razionale delle variabili x, ..., x, 
il rapporto di due polinomi in queste variabili. 

Si dice numero algebrico la radice di un polinomio i cui coefficienti sono 
numeri razionali. Si dice funzione algebrica delle variabili x,, ..., x, una fun- 
zione legata a x,, ..., x, da una relazione polinomiale. 

Si dice numero trascendente ogni numero non algebrico. Si dice funzione 


trascendente ogni funzione non algebrica. 
Tutti i numeri e tutte le funzioni razionali sono algebrici, ma il viceversa 


non è vero. Il numero /2, radice dell’equazione x?—2=0 è algebrico ma non 


razionale. Più in generale, se a>o è un numero razionale, n>2 è un intero e 
qualche numero primo p entra, nel numeratore o nel denominatore della rap- 
presentazione irriducibile di a, ad una potenza non divisibile per n, allora 1/4 
è un numero reale algebrico, ma non razionale. Ciò deriva senza difficoltà dal 
teorema sulla decomposizione unica dei numeri razionali positivi come prodot- 
to di potenze intere di numeri primi (si veda il $ 1.5 dell’articolo « Divisibili- 
tà» in questa stessa Enciclopedia, articolo cui si farà continuo riferimento in se- 


guito). 
Sono esempi di numeri trascendenti il rapporto tra la circonferenza e il dia- 


metro T= 3,1415927... e il numero di Nepero Y == e= 2,7182818... (cfr. $ 4). 
n=0 IL: 


Sono esempi di funzioni trascendenti: 27, tutte le funzioni trigonometriche, 
logx, la funzione di Bessel, ecc. 

L'etimologia del termine ‘razionale’ è legata alla rappresentazione delle 
operazioni di divisione dell’unità in parti uguali e alla loro successiva moltipli- 
cazione per una quantità, che portano a tutti i numeri razionali positivi o, che 
è lo stesso, alla costruzione delle relazioni di divisibilità intera dell'unità. Tutti 
i numeri che non è possibile ottenere in tale modo, come 4/2, i numeri negativi 
(anche se interi), i=4/—1, sono stati chiamati in tempi diversi «impossibili», 
«immaginari», «irrazionali», ecc. Dal punto di vista moderno in questi nomi si 
riflette il fatto che lo sviluppo storico del formalismo per lavorare coi numeri 
precedeva lo sviluppo della stessa rappresentazione del numero, vale a dire le 
interpretazioni di questo formalismo, e questi numeri denotarono a lungo un'e- 
sistenza fantomatica. Nella terminologia moderna la parola ‘irrazionale’ si è 
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riempita di tutti i numeri non razionali e ‘immaginario’ o ‘immaginario puro’ 
coi numeri RV/+1. i 

Tutti i numeri razionali costituiscono il campo @Q; tutti i numeri algebrici 
costituiscono il campo Q; i numeri trascendenti C\\Q non costituiscono un 
campo. Analoghe affermazioni valgono per le funzioni. Si ricordi che un campo 
è un insieme dotato delle operazioni di somma e di prodotto e degli elementi 
particolari o e 1; tutta questà struttura soddisfa gli assiomi dell’algebra elemen- 
tare, validi per i numeri. i 

Nella matematica dei nostri giorni, la matematica dei razionali (degli al- 
gebrici, dei trascendenti) costituisce un capitolo piuttosto rilevante dell’alge- 
bra e della teoria dei numeri. In algebra questi termini si applicano, nel senso 
più ampio della parola, in relazione a elementi di campi e di anelli, non neces- 
sariamente numerici o funzionali, e acquistano un senso relativo (si può parlare 
di elementi razionali, algebrici o trascendenti di qualche estensione di un anello, 
o di un campo, in relazione a un anello, o un campo, fondamentale). Nella 
teoria dei numeri si studiano in dettaglio l’aritmetica dei campi e degli anelli 
di numeri algebrici, i problemi di dimostrazione di trascendenza di varie classi 
di numeri, i problemi di approssimazione dei numeri trascendenti coi numeri 
algebrici, degli algebrici coi razionali, ecc. La parte principale di questo articolo 
($$ 2-4) è dedicata all’esposizione di alcuni concetti e di alcuni risultati fon- 
damentali di queste teorie. 0. 

La suddivisione dei numeri in razionali, algebrici e trascendenti riflette una 
classificazione dei numeri in base alla loro complessità. Questa classificazione 
ha una lunga storia; inseparabile dalla storia dello stesso concetto di numero e, 
in ultima analisi, dalla storia di tutta la matematica, in cui svolgono un ruolo 
fondamentale i concetti di numero e di figura geometrica. Si tracceranno qui 
brevemente le tappe di questa storia, organizzando l’esposizione intorno ad al- 
cune idee centrali, di significato matematico generale. Fra queste idee rientrano: 
i linguaggi per rappresentare i numeri e le operazioni su questi; l’interpreta- 
zione semantica dei numeri in termini di misure e l’astrazione geometrico- 
numerica del continuo; i problemi del finito/infinito, del continuo/discreto e 
dell’informazione. 


1.2. Il concetto di numero, linguaggio ed algebra. 


Dai dati della linguistica e dell’etnografia si possono estrarre informazioni 
indirette sui primi periodi della storia delle rappresentazioni numeriche, rela- 
tive ancora al periodo orale. In particolare il periodo «prematematico ) È ri- 
flesso nei seguenti aspetti del sistema di denominazione dei numeri nelle di- 
verse lingue riaturali. oe: ; 

a) In alcune lingue primitive esistono denominazioni solo per numeri na- 
turali piccoli, i rimanenti sono denotati con l’unica parola ‘molto’. Cosi nelle 
lingue papuane ende, kati, kamoro, esistono i due numerali propri 1 e 2, fino 
a 20 si conta corn le dita delle mani e dei piedi, a 20 la serie naturale «finisce ». 
Ovviamente il sistema {1, ..., 20, molto} può essere formalizzato senza difficoltà, 
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con leggi di composizione naturali, come un «piccolo universo» non-contrad- 
dittorio della matematica. Inoltre questa, e analoghe, serie naturali sono riprese 
in considerazione da una scuola sui fondamenti della matematica (gli «ultra- 
intuizionisti») con uguale, se non maggiore, diritto rispetto alla serie naturale 
standard della matematica classica. Tuttavia non si può sopravvalutare il si- 
gnificato di questa raffinata ripresa di coscienza per i primi stadi e rifiutare la 
potente idea di prosecuzione infinita, potenziale o anche attuale, della serie dei 
numeri interi. 

5) In alcune lingue si conservano varie serie di nomi dei naturali per contare 
oggetti di diversa natura (dritti, curvi, animati, inanimati, ecc.). Ciò testimonia 
del lungo periodo di formazione delle idee sui numeri come di strumenti adatti 
a contare «quanto si vuole». La coscienza umana per lungo tempo non è stata 
pronta a riunire in una «classe di equivalenza» insiemi arbitrari (anche se pic- 
coli) di uguale potenza; quest'idea applicata agli insiemi infiniti è una conqui- 
sta della matematica ottenuta con i lavori di Cantor. Traccia di simili tipi di- 
versi per contare si è conservata nel cinese moderno, dove esiste un unico si- 
stema di numerali, che è tuttavia completato da un evoluto sistema di parti- 
celle numerali utilizzate con sostantivi di varie classi, del tipo kudi ‘pezzo’, 
ge ‘cosa’, bén ‘radice’, ecc. 

c) In numerose lingue si osservano diverse radici dalle quali si formano cor- 
rispondenti numerali d’ordine e di quantità (cfr. uno/primo, duo/secundo in la- 
tino). In queste testimonianze si può vedere il primo sorgere dell’idea di or- 
dine (distinta da quella di quantità) che si costituirà come un concetto mate- 
matico autonomo molto più tardi (si vedano i «cardinali» e gli «ordinali» di 
Cantor e le strutture d’ordine di Bourbaki). 

I primi testi che ci sono giunti (babilonesi, egiziani) riflettono già un quadro 
evoluto delle conoscenze matematiche, in particolare la nascita di un linguaggio 
di notazioni matematiche abbastanza nettamente distinto dal linguaggio na- 
turale. In esso il posto principale è occupato dal sistema per denotare i numeri 
e le operazioni su questi. La preistoria del sistema posizionale di notazione di 
tipo moderno è basata sull'idea di contare unità sempre più grandi. Queste 
unità possono essere potenze di uno stesso numero (base del sistema posizio- 
nale) ma non è necessario. Cosi nel sistema cronologico dei Maya le unità sono 
I, 18, 360 e poi 18-20° (si vedano le tracce della numerazione in base 20 nei 
numerali francesi del tipo quatre-vingt-six). L'unità d’ordine superiore è no- 
tata con un simbolo speciale, che all’inizio può dipendere dal numero d’ordine 
(presso gli Egiziani, i Greci, i Romani). Quando questo simbolo cessa di dipen- 
dere dal numero d’ordine e il successivo è determinato soltanto dalla posizione 
nell’allineamento allora, per una notazione non ambigua, diventa necessario il 
simbolo zero. Si ritiene che la sua comparsa sia abbastanza lontana; al termine 
della tradizione babilonese l'assenza di'unità di un dato ordine viene denotata 
con uno zero soltanto a metà della scrittura. L’idea che il simbolo zero non sia 
soltanto un segno, ma la notazione di un autentico numero, compare molto più 
tardi ed è attribuita agli Indiani, dai quali l'avrebbe adottata la matematica eu- 
ropea attraverso l’influenza araba. La notazione posizionale contiene già il ger- 


Razionale/algebrico/trascendente 606 


me della teoria delle operazioni algebriche sui numeri: la notazione richiede il 
prodotto di unità di ordine successivo per il numero di questa unità e la somma 
dei risultati. 

Ulteriori sviluppi delle rappresentazioni numeriche sono legate all’uscita 
dal dominio dei numeri naturali. 

Alla matematica babilonese è attribuito lo sviluppo dell’apparato di calcolo 
strettamente legato ai bisogni delle costruzioni e dell'economia, il quale ha 
condotto 1) all’abitudine ad operare con numeri non interi e relativamente 
grandi, 2) all’uso sistematico della prima operazione non razionale: l’estra- 
zione di radice quadrata, e alla scoperta che questa è sufficiente per risolvere le 
equazioni quadratiche e biquadratiche. Nella maggior parte dei testi noti si 
estrae la radice quadrata solo dei quadrati perfetti; in casi eccezionali si usano 
approssimazioni abbastanza grossolane. Numeri negativi (compresa la loro 
interpretazione semantica come «debiti») si trovano nei documenti indiani. 
Tuttavia le regole formali per manipolarli sono di molto successive al sorgere 
del «modello standard» di continuo numerico, di modo che, in accordo con 
Bourbaki [1960], «in pieno xv secolo, d’Alembert, discutendo la questione 
nell’Erncyclopédie... si perde improvvisamente d’animo dopo una colonna di 
spiegazioni piuttosto confuse, e si accontenta di concludere che “le regole delle 
operazioni algebriche sulle quantità negative sono generalmente ammesse da 
tutto il mondo ed accolte generalmente come esatte, quale che sia l’idea che si 
attribuisce a tali quantità” » (trad. it. p. 30). 

Non va assunto un atteggiamento ironico verso queste difficoltà, le quali, 
come mostra la storia, sorgono inevitabilmente ad ogni livello del pensiero ma- 
tematico (si veda l'articolo «Insieme» in questa stessa Enciclopedia); le si deve 
considerare tappe di una graduale presa di coscienza dell’idea fondamentale di 
separazione del linguaggio matematico dalla sua interpretazione (oggi essen- 
zialmente insiemistica) e dell'idea di non-contraddittorietà del formalismo, 
come sostituti del concetto di «esistenza» degli oggetti matematici, formulata 
chiaramente nello storico manifesto di Hilbert del 1900. 

In effetti, come è stato già ricordato, i numeri negativi e quelli complessi, 
fino al xviri-xIx secolo figurano in matematica soprattutto come «interpreta- 
zioni potenziali» di qualche formalismo, piuttosto che come enti matematici 
definiti per se stessi. Questo formalismo consiste nel considerare espressioni con 
radici dei vari ordini, anche «ripetute», e nell’elaborazione di alcune regole per 
agire su esse. In questo modo occorre considerare, ad esempio, Ie formule di 
Bombelli (1572) {/2+-VT121=2+/1, di Leonardo da Pisa Y16+#/54= 


=%250, 0, infine, le formule generali di Del Ferro (1545) per le radici del- 


l'equazione x3-+ax = b: 
TAV 3 2 la 
(G1+G<Vi VG) 
2 3 3 


Come è noto, nel caso (5/2)?+(a/3)8<0 occorre calcolare la radice reale, per 
mezzo di queste formule, passando attraverso grandezze complesse, le quali si 
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presentano come oggetti di calcolo «ideali», vale a dire «non interpretabili». 

Ovviamente quest'idea fu compresa completamente molto pi tardi e, fino 
alla formazione della teoria degli insiemi da un lato e della metamatematica 
dall’altro, non poté essere totalmente assimilata. Tuttavia la compatibilità in- 
terna dei buoni formalismi al di fuori del dominio della loro applicazione ori- 
ginaria è un fenomeno continuamente ricorrente nella storia della matematica 
e uno dei maggiori fattori di progresso. Uno degli esempi più moderni è l’in- 
tegrale di Feynmann (si veda il $ 3.3 dell’articolo « Dipendenza/indipendenza» 
in questa stessa Enciclopedia). 

Occorre anche tener conto del fatto che ogni formalismo è «immediata- 
mente accessibile» e che è un concetto finito, mentre le interpretazioni sono 
sottoposte a variazioni storiche e soprattutto sono semanticamente multiformi, 


1.3. Il concetto di numero, geometria e teoria degli insiemi. 


Una seconda corrente di idee risale alla matematica greca, nella quale sorge 
il concetto di continuo numerico come astrazione delle figure geometriche e 
della teoria delle relazioni. Bourbaki sottolinea che sia la parola sia l’idea di 
numero, nella teoria di Eudosso esposta da Euclide, si rivolgono esclusivamente 
ai numeri interi maggiori di 1. I numeri sono considerati come un sistema con 
somma e prodotto. I rapporti fra numeri, cioè i numeri razionali (positivi) nella 
terminologia moderna, sono introdotti come operatori che agiscono su domini 
di grandezze di una stessa natura (lunghezze, aree, ecc.): il numero ab! è 
l'operatore che consiste nel costruire @ parti b-esime di una data grandezza. 
Questi operatori possono moltiplicarsi, ma non comporsi. Grandezze della 
stessa natura possono essere confrontate e soddisfano il noto «assioma di Ar- 
chimede»: la somma di un numero abbastanza alto di esemplari di una data 
grandezza può diventare grande quanto si vuole. La struttura algebrica dei 
numeri reali, in tal modo, rimane suddivisa in un dominio degli operatori (pro- 
dotto) e in un dominio delle grandezze stesse (somma). Il concetto di ordine 
svolge un ruolo fondamentale per dare un senso alla relazione fra grandezze 
incommensurabili, come la diagonale di un quadrato e il suo lato, e ciò permette 
di considerare Eudosso come un precursore della teoria dei numeri reali secondo 
Dedekind. Il concetto di continuo topologico si costituisce anch’esso in ricer- 
che come il problema della duplicazione del cubo. La costruzione di #2, ne- 
cessaria alla sua soluzione, si riduce alla ricerca del punto d’intersezione di due 
curve, le quali si costruiscono con un processo meccanico idealizzato. L’esi- 
stenza di un punto d’intersezione come conseguenza del fatto che la seconda 
curva contiene punti che si trovano da parti opposte della prima, evidentemente, 
era considerata come ovvia. È noto il ruolo che svolge il corrispondente teorema 
nel sistema della matematica contemporanea, 

Infine la rappresentazione del continuo geometrico come ricettacolo di re- 
lazioni numeriche fu un’idea precorritrice della geometria analitica di Descartes, 
da un lato, e della teoria degli insiemi dall’altro. Dal punto di vista psicologico, 
la percezione visiva che sta alla base delle rappresentazioni geometriche si con- 
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figura come l’unico canale di passaggio che collega l’uomo col mondo esterno. 
A queste sue particolarità è legata la possibilità di astrazione del continuo in 
quanto oggetto in cui un insieme di posizioni di un punto, fra due punti dati, 
possiede le proprietà di continuità e di estensione illimitata in profondità — 
un’idea che solo indirettamente e a fatica si formula nel linguaggio delle suc- 
cessioni potenzialmente infinite di simboli numerici, sviluppati rispetto a un 
dato sistema di numerazione. Soprattutto, l’infinità del continuo si concepisce 
più facilmente come assegnata attualmente. 

L'eliminazione del dualismo numeri discreti / relazioni continue fra gran- 
dezze nel significato generale dei numeri reali, richiese ancora molti secoli di 
sviluppo. Tuttavia l'accessibilità immediata del continuo alla intuizione, sep- 
pure limitata, svolse un ruolo importante nell’assegnazione di uno status rico- 
nosciuto ai numeri complessi, dopo la scoperta della loro interpretazione come 
punti del piano complesso. Per questo, teorie come quella dei limiti di Cauchy, 
la costruzione dei numeri reali secondo Dedekind e Cantor, l’algebra complessa 
e l’analisi, possono essere considerate il punto d’incontro nella formazione di 
un formalismo che descrive l’idealizzazione di un dato quasi «fisico », «a priori», 
della realtà. L’unione di questi due indirizzi si verificò sulla base della teoria 
degli insiemi. 

Per tornare al tema immediato di questo articolo, il termine ‘trascendente’ 
appartiene a Leibniz. Fu introdotto, evidentemente, in relazione alle funzioni. 
In particolare Leibniz dimostrò (1682) che sinx non è una funzione algebrica 
di x e risolvette allo stesso tempo il problema di Gregori (1667): l'area di un 
settore circolare non si esprime algebricamente per mezzo del raggio e della 
corda. 

L'esistenza di numeri trascendenti fu dimostrata per la prima volta da Liou- 
ville (1844) per mezzo della seguente, considerevole, osservazione, che dette 
inizio alla moderna teoria dell’approssimazione. Sia x una radice irrazionale 
del polinomio irriducibile f(x) di grado n a coefficienti interi. Allora, per ogni 


numero razionale p/q si ha 
d P i 
-|z0o>|f[=)|>-. 
s( ‘(£) | q 


q 
D'altro lato se p/q è abbastanza vicino a «, allora f(p/9)=[(p/9)-a]f (x) e 
F(«)3}0. Da qui si conclude facilmente che |x— (p/9){=c/g" per una costante 
opportuna c>o e per ogni numeri razionale p/g. Di conseguenza, se per il nu- 
mero dato xe R e per ogni c>o0, v>o esistono f,g€Z tali che |a—(p/9)| <(c/9”), 


x ; : ; Si FI 
allora a non può essere algebrico. Un esempio semplice x=) —: con le som- 
n=o 2 


Lui I È È 

me parziali )) — questo numero viene approssimato molto bene. 
n=12 . 

La trascendenza di numeri come e e x, tuttavia, non si può dimostrare con 

il metodo di Liouville. La trascendenza di e fu stabilita da Hermite (18/73) e per 

re da Lindemann (1882), dopo che aveva dimostrato in tal modo l'impossibilità 

di quadrare il cerchio per mezzo di riga e compasso — un antico problema che 
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serviva da stimolo per queste ricerche. Un accenno a questa dimostrazione è 
riportato più avanti, nel $ 4. Nella nostra epoca la teoria dei trascendenti ha 
molti risultati e non meno problemi irrisolti. Ad esempio la questione della 


N 
«costante di Eulero» C = lim (È =—logN rimane irrisolta. La maggior parte 
N->c0 \R=1 

dei problemi relativi alla trascendenza di numeri concreti è riferita a numeri as- 
segnati «analiticamente», vale a dire come valori di varie funzioni, come loro 
zeri, ecc. Di regola questi numeri possono essere calcolati algoritmicamente 
con la precisione che si vuole. Allo stesso tempo essi costituiscono solo una pic- 
cola parte di tutto il continuo, come è stato dimostrato in una famosa dimostra- 
zione di esistenza dei numeri trascendenti da parte di Cantor. 

La dimostrazione di Cantor è basata sulla sua teoria delle potenze degli 
insiemi infiniti e consiste nella constatazione del fatto che l'insieme dei numeri 
algebrici è numerabile, mentre l’insieme di tutti i numeri reali (e complessi) 
ha la potenza del continuo, nettamente maggiore. La considerazione di Cantor 
presenta il difetto di non essere effettiva, vale a dire stabilisce l’esistenza (e la 
potenza) dei numeri trascendenti senza la possibilità di costruirne «esplicita- 
mente», cioè con i passaggi al limite consueti in matematica, anche uno solo di 
essi. Allo stesso tempo possiede il notevole pregio di generalizzarsi a qualunque 
classe numerica generata da un processo finito, o almeno descrivibile in un lin- 
guaggio formale di tipo finito. Fra le classi più importanti di questo tipo rientra 
il «continuo costruttivo». 


1.4. Il concetto di numero e l’informazione. 


Il continuo costruttivo (in diverse varianti) fu proposto dai moderni critici 
dei fondamenti della matematica come un’alternativa al continuo classico al- 
l’interno della «matematica alternativa», che non utilizza il concetto di infinità 
effettiva. Elementi del continuo costruttive di Markov sono classi di successioni 
di Cauchy effettivamente computabili di numeri razionali (@,) per le quali esi- 
stono le funzioni effettivamente computabili f : Z-+Q, f(n)--0 per n-+c0, e 
g:Z>Z tali che |a,— an] <f(M) quando n,m>g(M). 

Si riuniscono nella stessa classe le successioni che convergono allo stesso 
numero, in senso classico. 

La complessità dei problemi strutturali del continuo costruttivo è legata 
già al fatto che il problema di identificare due numeri reali, assegnati mediante 
algoritmi di calcolo delle loro successioni di Cauchy (4,) e (b,), non è algorit- 
micamente risolubile. Ma anche rinunziando alla proibizione di definizioni non 
effettive, il continuo costruttivo, in quanto oggetto della matematica classica, 
è poco studiato. Fra l’altro si tratta di un oggetto assolutamente fondamentale, 
in quanto gran parte dei problemi di teoria dei numeri, sia algebrici sia trascen- 
denti, si pone essenzialmente al suo interno. I numeri costruttivi sono numeri 
che portano una «quantità finita d’informazione » e come tali svolgono un ruolo 
particolare. I numeri non costruttivi si potrebbero chiamare « ultra-trascenden- 
ti»: ciascuno di questi numeri, in qualche senso del termine, non è dato da una 
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computazione finita. Naturalmente sono possibili generalizzazioni e varianti. 
Ad esempio, più ampia del continuo costruttivo è la classe dei numeri « per i 
quali è derivabile nella teoria degli insiemi la formula Hla(P(a)), dove P(x) è 
una formula del linguaggio della teoria degli insiemi, con la variabile libera x, 
che assume valore in R. In qualche senso si può considerare che questi numeri 
siano ancora descritti in maniera finita, anche se non necessariamente computati 
in maniera finita. 

L’argomento di Cantor mostra che tutti questi «continui » sono numerabili. 
Il loro studio è un compito del futuro. 


2. Anelli, campi e teoria di Galois. 


1. La costruzione dei razionali. 


Il campo dei numeri razionali Q si ottiene dall’anello dei numeri interi Z 
con l’aggiunta di tutte le frazioni pg-!, vale a dire dei risultati della divisione 
formale di numeri interi, non realizzabile in Z. Il campo dei numeri algebrici 
Q si ottiene dal campo Q con l’aggiunta delle radici dei polinomi a coefficienti 
razionali, che di per sé non appartengono a Q. Anche il campo dei numeri reali 
R può essere descritto come il risultato che si ottiene da una «operazione in- 
finita» — il passaggio al limite per le successioni formate da elementi di Q. L’'as- 
siomatizzazione di queste idee nell’algebra moderna conduce alla teoria degli 
anelli e dei campi astratti, alle loro estensioni, ai completamenti topologici, ecc. 
Il punto di partenza per lo studio dell’aritmetica degli anelli e dei campi nu- 
merici e funzionali, è costituito proprio dai concetti generali cui tale assio- 
matizzazione ha condotto. 


2.2. Anelli commutativi e domini d’integrità. 


Si ricordi che un anello è un insieme A con due operazioni di somma e di 
prodotto, con gli elementi distinti o e 1, i quali soddisfano agli abituali assiomi 
dell’algebra elementare. Ci si limita qui al caso di anelli con prodotto commu- 
tativo. Un anello si dice dominio d’integrità se non ha divisori dello zero, vale 
a dire se da ab=0 segue 4=0 oppure d=o. Un anello si dice campo quando 
A*=A- {o} è un gruppo rispetto al prodotto. Ogni campo è un dominio 
d’integrità. In ogni anello commutativo A esiste un sottoanello minimo con- 
tenente l’unità: è costituito da tutti i multipli interi dell’unità ed è isomorfo a Z 
oppure a Z/mZ, me Z, m>o. Se un dominio d’integrità contiene un sottoanello 
isomorfo a Z/mZ, allora m deve essere necessariamente un numero primo (al- 
trimenti in Z/mZ esisterebbe un divisore dell’unità), che si chiama caratteristi- 
ca di A. Se ZCA si dice che la caratteristica è zero. Gli anelli Z e Z/pZ, con p 
primo, si dicono primi; ogni dominio d’integrità contiene un sottoanello primo. 
Se A e B sono due anelli e A € 8, allora B si dice estensione di A. 
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2.3. Costruzioni di anelli. 


La principale costruzione è l'aggiunta di una variabile indipendente. Per 
descriverla si ponga 


B={(2, 4, 4, ...)|a;c A, Hi, Vi=i, 4;> 0}. 


In altri termini 8 è l'insieme delle successioni infinite di elementi di A che, 
tranne un numero finito, sono nulli. S'introduca in B una struttura di anello 


commutativo ponendo (4;)+(0;)=(4;+5;), (4,)-(0,) = D ad; di). È facile ve- 
rificare gli assiomi per B; in particolare (0, 0, ...) è lo zero, mentre (1, 0, 0, ...) 
è l’unità in B. Si ponga quindi 7= (0, 1, 0, ...)c B; allora (4,;)= D a;T' (quasi 


tutti i «monomi» a;7° sono uguali a zero) e la scrittura di ogni clemento di B 
in questa forma è unica. Pertanto si può identificare l’anello B con l’anello 
A[T] dei polinomi nella «variabile indipendente» 7, a coefficienti in A. Ite- 
rando questa costruzione un numero finito di volte si ottiene l'anello dei po- 
linomi in x variabili 4[T, ..., T,]. L’ordine con cui si aggiungono le variabi- 
li è indifferente, nel senso che aggiungendo in ordine diverso le stesse variabili 
gli anelli ottenuti sono isomorfi in maniera canonica. Ciò permette di definire 
l’anello dei polinomi A[S]i in un insieme qualsiasi di variabili S come JA[S;], 
dove ..._SjCS;y1 ©... è una successione d’insiemi finiti che esaurisce S (se S 
non è numerabile, bisogna usare gli ordinali e non solo i numeri interi come indi- 
ci della successione). Si ha un’immersione insiemistica canonica di S in A[S]. 

Se A è un dominio d’integrità, allora anche A[.S] è un dominio d’integrità. 
L’anello A[S] è caratterizzato dalla seguente proprietà universale: per ogni 
omomorfismo di anelli f: A-+B e ogni applicazione insiemistica g : S+B, 
esiste un unico omomorfismo 4 : A4[S]- B, coincidente con f su A e con g su S. 

Da qui segue che ogni dominio d’integrità A è isomorfo al quoziente di un 
anello di polinomi A;[S], dove Ay=Z oppure Z/pZ è un anello primo con la 
stessa caratteristica di A. Affinché il quoziente A/i dell’anello A rispetto al- 
l’ideale i sia un dominio d’integrità, è necessario e sufficiente che l’ideale i sia 
primo (cfr. il $ 4.5 dell'articolo « Divisibilità » in questa stessa Enciclopedia). 


2.4. Campo dei quozienti di un dominio d’integrità. 


Sia A un dominio d’integrità e sia S= (AN {o})x A. È comodo denotare 
con T(g,p) l'elemento di .S corrispondente alla coppia (g,p). Si consideri il 
quoziente K= A[.S]/i rispetto all’ideale i generato da tutti i polinomi di tipo 
aT(4g,p)-p. Non è difficile vedere che si tratta di un campo e che l’applica- 
zione canonica A+ 4[S]- A[S]/i è un monomorfismo. Identificando A con la 
sua immagine in X, si può mostrare che ogni elemento di K si rappresenta nella 
forma ab, a, be A, b #0; in particolare l’immagine di 7(9,p) in K è pg. Una 
costruzione equivalente di K è la seguente: si consideri lo stesso insieme S e 
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s’introduca in esso la relazione di equivalenza: (9,) > (9;p') se e solo se esi- 
stono degli elementi r,7' e A\ {0} tali che (r9,7p9)= (7'9;7‘p'). Si denoti con K 
il quoziente di S rispetto a questa relazione di equivalenza e s’introducano in 
esso le operazioni di somma e di prodotto: classe (g,p) x classe(g;p')= clas- 
se(ggipp'); classe(g,p)+classe(g;p')= classe(gg;pg'+g'p). Si può dimostrare 
che questa definizione è corretta e X costituisce un campo contenente A4= 
= {classi(1,p}} in cui classe(g,p) = 9. 

Il campo XK costruito sopra si dice campo dei quozienti del dominio d’inte- 
grità A. L’immersione ACK dell'anello A nel suo campo dei quozienti possie- 
de la seguente proprietà universale: per ogni monomorfismo f : A+ L dell’anel- 
lo A nel campo Z esiste un unico monomorfismo K-+L coincidente con f su A. 

Il campo dei quozienti dell’anello dei numeri interi Z coincide col campo 
dei numeri razionali Q: si dice campo primo di caratteristica zero. Gli anelli 
primi Z/pZ stessi sono campi. Si tratta di campi primi di caratteristica finita. 
Ogni campo possiede un sottocampo primo della stessa caratteristica. 

Se K è un campo, 7, ..., 7,, sono variabili, il campo dei quozienti dell’anello 
K[T,, ..., Ty] si denota con K(T,, ..., 7,) e si chiama campo delle funzioni ra- 
zionali in 7}, ..., T, a coefficienti in K. 

Entrambe le costruzioni del campo dei quozienti ammettono varianti e ge- 
neralizzazioni nel caso in cui non si supponga che A sia un dominio d’integrità. 
La più generale di queste è la costruzione dell'anello dei quozienti Ax rispetto 
a un sottomonoide (relativo al prodotto) RCA: l’anello Ag è costituito dai 
rapporti formali ar7!, dove ae A, re R, con le abituali regole per operare sulle 
frazioni. Si ha sempre un omomorfismo canonico A+Ag: aH+a-17!, ma questo 
può non essere un’immersione, se R contiene divisori dello zero. 

Le operazioni di somma e di prodotto, e le loro inverse — sottrazione e di- 
visione — sono tradizionalmente dette operazioni razionali. La teoria degli anelli 
e dei campi è la teoria generale delle «operazioni razionali» negli insiemi. 


2.5. Campi ed estensioni di campi. 


Siano K ed L due campi e sia K CL; in questo caso il campo L si dice esten- 
sione del campo K e si denota a volte con L/K. Un elemento ae L si dice alge- 
brico su K se è radice di un polinomio a coefficienti in K. In caso contrario 
l'elemento ae L si dice trascendente su K. Un’estensione L del campo XK si dice 
algebrica su K se tutti i suoi elementi sono algebrici su K. Un’estensione L si 
dice trascendente pura su K se è isomorfa al campo dei quozienti di un anello 
di polinomi K[T}, 7», ...]. In altri termini, L si ottiene aggiungendo a K degli 
elementi algebricamente indipendenti. 


2.6. Grado di trascendenza. 


Per ogni estensione di campi KCL è possibile trovare un campo intermedio 


M, KCMCL, tale che l'estensione K CM sia puramente trascendente e l’esten- - 


sione MCL sia algebrica. Il campo MM non è univocamente determinato, tut- 
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tavia il numero di elementi trascendenti che occorre aggiungere a K per ottenere 
M dipende solo da L. Questo numero è detto grado di trascendenza dell’esten- 
sione KCL. 


2.7. Grado delle estensioni algebriche. 


Se l'estensione K CL è algebrica, vale a dire il suo grado di trascendenza è 
nullo, allora la dimensione di L come spazio lineare su KX si dice grado di L. 
Se questa dimensione è finita, l'estensione K CL è necessariamente algebrica: 
ogni elemento ae L si può rappresentare con una matrice di prodotto per 4 
rispetto a una opportuna base di ZL su XK, e questa matrice, e con essa a, è la ra- 
dice della sua equazione caratteristica. 'l'uttavia possono sussistere estensioni 
algebriche di grado infinito: sono tali ad esempio le chiusure algebriche dei 
campi primi. 


2.8. Estensioni algebriche separabili e non separabili. 


Sia KCL un'estensione di campi e ae L sia algebrico su K. Allora a è ra- 
dice di un polinomio f irriducibile su K e questo polinomio è univocamente 
determinato a meno di un fattore non nullo di X. L'elemento 4 si dice separa- 
bile su K se f non ha radici multiple. Un’estensione algebrica L/K si dice se- 
parabile se tutti gli elementi di Z sono separabili su X. Quando la caratteristica 
del campo K è zero, tutte le sue estensioni sono separabili. Sono separabili anche 
tutte le estensioni algebriche dei campi primi e, più in generale, dei campi per- 
fetti di caratteristica ), vale a direi campi K con la proprietà KP? =xp{a?|acK}= 
=K. Se KP:#K l’estensione K?CK è algebrica e non separabile. Il motivo di 
ciò risiede nel fatto che se te K e té K?, il polinomio x? — #? è irriducibile su K? 
ma tutte le sue radici coincidono, giacché aP—f?= (x—t)?. 


2.9. Estensioni finite di Galois. 


Sia L un campo, G un gruppo finito di suoi automorfismi, cioè di applica- 
zioni biiettive L+L che portano la somma di elementi nella somma delle loro 
immagini e il prodotto nel prodotto delle immagini. Si denoti con L°=K 
l'insieme dei punti uniti, vale a dire K={xeL]|gx=x per ogni ge G}. Non è 
difficile vedere che K è un campo. 

Le affermazioni che seguono costituiscono la parte centrale della teoria di 
Galois. ; 

a) L'estensione KCL è un'estensione finita, separabile, di grado Card G 
(cioè il numero di elementi di G). Il gruppo G è il gruppo di tutti gli automor- 
fismi di L che lasciano invariati tutti gli elementi di K. 

b) Si faccia corrispondere ad ogni sottogruppo HCG il campo dei suoi ele- 
menti uniti LF. Allora la corrispondenza H+ LF determina una biiezione fra 
l'insieme dei sottogruppi di G e l’insieme dei campi M, intermedi fra K e L. 
Questa biiezione inverte l’ordine rispetto all’inclusione: H, CH, &LH1>LM:. 
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Le estensioni XCL del tipo descritto si dicono estensioni di Galois con 
gruppo di Galois G. 

c) Nella situazione descritta l'estensione XCLF è un'estensione di Galois 
se e solo se HCG è un sottogruppo normale e, se questa condizione è soddi- 
sfatta, il gruppo di Galois di Kc LF è canonicamente isomorfo a G/H. 


2.10. Esempi. 


a) K=Q, L=Q(€) dove & è una radice primitiva di ordine #m dell’unità. 
Per ogni numero intero n, primo con m, l'applicazione éH+É" induce un auto- 
morfismo di L su Q, dipendente solo dalla classe dei resti di 7 modm. Tutti gli 
automorfismi di questo tipo costituiscono un gruppo canonicamente isomorfo 
al gruppo delle classi di resti (Z/mZ)* rispetto al prodotto. Il suo ordine è 
uguale a p(m) (funzione di Eulero) e tale è anche il grado dimogL=[L: Q]. 
Pertanto L/Q è un’estensione di Galois. 

b) Sia ancora L=Q(€) e acQ(é) sia un elemento tale che l’estensione 
M=L(/a) abbia grado m su L, vale a dire il polinomio x*—a sia irriducibile 
su L. Allora per ogni numero intero n, l'applicazione 4/aH»É"/@a induce un 
automorfismo di M rispetto a L. Tutto il gruppo di questi automorfismi è iso- 
morfo al gruppo 4, delle radici di grado m dell’unità, e L CM è un'estensione 
di Galois con gruppo Um. 

c) Sia p un numero primo, F,=Z/pZ, qg=p"m=1; F,è un campo finito cong 
elementi (cfr. ancora « Divisibilità », $ 4.3). L'applicazione D: F,>F, D(x)= a? 
è un automorfismo del campo F,; F, coincide col campo dei suoi elementi uniti. 
Tutte le potenze di ® costituiscono un gruppo ciclico di ordine m, il quale è 
il gruppo di Galois dell’estensione F, CF, 

d) Sia K un campo di caratteristica diversa da 2 e da 3, f(X)= X3+aX+b, 
a,be K. Si indichi con L il campo ottenuto aggiungendo a K tutte le radici di f. 
L'estensione KCL è un'estensione di Galois con gruppo simmetrico $S3 di 
ordine 6 se e solo se il discriminante A= — 46°— 276? non è un quadrato nel 
campo K. 


2.11. Caratterizzazione delle estensioni di Galois. 


Un’estensione algebrica KCL si dice normale se possiede la seguente pro- 
prietà: ogni polinomio di K[T] irriducibile in K che ha una radice in L si 
decompone in fattori lineari in L[T]. 

Un’estensione algebrica finita XCL è un’estensione di Galois se e soltanto 
se è normale e separabile. 


2.12. Estensioni generali di Galois. 


Un’estensione algebrica KCL si dice estensione di Galois se si può rap- 
presentare come unione di estensioni finite di Galois. I risultati del $ 2.8 si 
trasferiscono a questo caso se nel gruppo totale degli automorfismi di L su K 
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s’introduce la topologia di Krull, nella quale una base di intorni dell’unità è 
data dai sottogruppi di automorfismi che lasciano fisse le sottoestensioni finite 
L su K. La corrispondenza HH LF determina allora una biiezione fra i sotto- 
gruppi chiusi del gruppo di Galois dell'estensione X CL e i campi intermedi 
fra K e L, non necessariamente di grado finito su K. 
_ Se il campo K è perfetto e X è la sua chiusura algebrica, allora l'estensione 
K/K è un’estensione di Galois. Il suo gruppo di Galois Gal(K/K) è il princi- 
pale invariante del campo. Esso è computabile solo in alcuni casi. In particolare 
per K=Q (o un'estensione finita di Q) la sua struttura è ben lontana dall’es- 
sere chiara. Numerosi risultati sul suo quoziente rispetto ai commutatori, cioè 
sul gruppo di Galois dell’estensione abeliana massimale del campo numerico K, 
sono oggetto della profonda teoria dei campi di classi, di cui si tratterà più 
dettagliatamente nel prossimo paragrafo. Ecco due esempi in cui si può cal- 
colare il gruppo Gal(K/K). . 

a) K=F,. Qui K è l'unione di tutti i campi Fm, m>1. Il gruppo Gal(F,/F,) 
è generato topologicamente dall’automorfismo di Frobenius ® : xHx?, Ciò si- 
gnifica che è il completamento rispetto alla topologia di Krull del gruppo ciclico 
libero Z={®"|meZ}. Una base di intorni dello zero in questa topologia è 
costituita da tutti i sottogruppi del tipo nZ, ne Z. Il completamento Z rispetto 
ad essa è isomorfo a | [Z, — prodotto di gruppi d’interi p-adici rispetto a tutti i 


numeri primi p, con la topologia del prodotto delle topologie p-adiche. 

b) K=C(t) sia il campo delle funzioni razionali in una incognita, a coef- 
ficienti complessi. Qui la descrizione del gruppo Gal(K/K) si basa sulle se- 
guenti considerazioni topologico-analitiche. Si rappresenti il campo XK come 
campo delle funzioni meromorfe sulla sfera di Riemann X. Ogni estensione 
algebrica finita LCK si può rappresentare, in maniera analoga, come campo 
delle funzioni meromorfe sulla superficie compatta di Riemann Y, rivestimento 
d’ordine finito di X. Questo rivestimento si ramifica in un numero finito di 
punti P,, ..., P,€ X, dipendenti da L. Una classificazione puramente topologica 
di questi rivestimenti li associa ai sottogruppi di indice finito del gruppo fon- 
damentale 71(X—{P,, ..., P,}) il quale è il gruppo libero (non commutativo) 
con s—1 generatori. Ogni rivestimento topologico di questo tipo ha una strut- 
tura complessa naturale, di modo che ad esso si associa il corrispondente campo 
delle funzioni meromorfe L (cfr. l'articolo «Locale/globale» in questa stessa 
Enciclopedia, $ 3). Come risultato il gruppo Gal(C(#)/C(t)) si può identificare 
col limite proiettivo limm,(X—S)/H, dove S varia lungo i sottoinsiemi finiti 


di X e H lungo i divisori normali di indice finito. Gal(C(#)/C()), in termini 
tecnici, è un «gruppo libero profinito con un insieme continuo di generatori ). 

Queste considerazioni geometriche si trasferiscono al caso di campi più 
generali K, contenenti elementi trascendenti su sottocampi primi, almeno 
quando X ha un grado di trascendenza finito. Essi mostrano il profondo legame 
della teoria di Galois di questi campi con ia topologia delle varietà. Inoltre la 
teoria di Galois del campo 7,(t) e delle sue estensioni finite fornisce un buon 
esempio di «poligono di prova» per l’aritmetica dei numeri algebrici. Infatti, 
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da un lato la torre F,[t] CF, (1) cF,(t) possiede proprietà algebriche prossime 
alle proprietà della torre ZCQCQ. D'altro lato ad essa è applicabile una no- 
tevole tecnica algebro-geometrica nella quale si hanno analoghi per quasi tutti 
i metodi della topologia classica e della teoria delle funzioni su una superficie 
di Riemann, compreso la teoria della (co)omologia {si vedano i particolari in 
Safarevi& 1962]. 


3. Aritmetica dei numeri algebrici. 


3.1. Numeri algebrici interi. 


Si consideri inizialmente la seguente situazione generale: sia A un anello 
commutativo, K il suo campo dei quozienti, KCL un'estensione algebrica di 
campi. In L si consideri l’insieme B di quegli elementi che sono radici di po- 
linomi a coefficienti in A e coefficiente direttore uguale all’unità. Evidentemente 
B>A; si può dimostrare che B è un anello. Si chiama chiusura intera dell’anello 
A nell’estensione L. 

Sia ora QCK un'estensione finita. Si dice anello dei numeri algebrici interi 
A in K la chiusura intera dell’anello dei numeri interi Z in K. Se il grado di K 
su Q è uguale a n, allora A è uno Z-modulo libero di rango n. In altri termini 
esiste una base libera &w,,...,0,€ 4! ogni elemento di A si rappresenta univo- 


camente come combinazione lineare x ao; «eZ. 


Ad esempio se K=Q(V), con mayo numero intero non divisibile per 
un quadrato, allora A= ITA per m=2, 3 mod4 e A=Z+Z[(1+vm)/2] 
perm=1 Oc SE K=Q(E), dove € è una radice primitiva dell’unità di ordine 


m, allora As DI ZE, dove p(m) è la funzione di Eulero. 


Se L/K è è un "estensione algebrica finita di campi, ae L, allora il prodotto 
per 4 si può rappresentare con una matrice ad elementi in K rispetto a una 
base lineare di ZL su K. Il determinante e la traccia di questa matrice non di- 
pendono dalla scelta della base; si chiamano norma (Nz,x a) e traccia (Trz,x @) 
dell'elemento a. La norma e la traccia (su Q) di un numero algebrico intero 
sono usuali numeri interi. Se QCX, ae K, la norma di a è il prodotto di tutti 
i numeri coniugati con 4 (immagini di 4 rispetto alle diverse immersioni iso- 
morfe di K in C) e la traccia di a è la loro somma. 


3.2. Ideali. 


Sia A l’anello dei numeri algebrici interi di un’estensione finita del campo 
Q. Ogni ideale a non nullo dell'anello A è tale che il quoziente A/qa è finito; il 
suo numero di elementi si chiama norma di a (N(a)). Se (a)= Aa, ac A, è 
un ideale principale, allora N((2))= N(2)=Ng,o(4). 

Se yc A è un ideale primo non nullo, allora N(9)=p/ (dove p è un nu- 
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mero primo), f è il grado del campo delle classi di resti rispetto al proprio sot- 
tocampo primo. Il semigruppo di tutti gli ideali non nulli dell'anello A è ge- 
nerato in PIADIGIA libera dagli dra primi: ogni hi si rappresenta univocamente 


nella forma a= vt. Se = ]Trts allora > e;f;=n, dove N(9,)=ph (p 


numero primo). ?! 


Una descrizione esplicita delle leggi delle decomposizioni (p)= Il pi 0 
=i 
almeno delle loro caratteristiche numeriche g, e;, f; in termini del numero primo 


d è uno dei principali problemi dell’aritmetica dei numeri algebrici. Una sua 
variante è data dalle leggi relative di decomposizione degli ideali primi del- 
l’anello A, estesi al sopra-anello B, dove Ac B è l’anello dei numeri algebrici 
interi di una coppia di estensioni finite del campo Q. L'informazione essenziale 
sulle leggi di decomposizione delle estensioni abeliane è costituita dalla teoria 
dei campi di classi (si veda oltre); le leggi non abeliane di estensione sono stu- 
diate molto po 


Se (p)= Il vé, un ideale t);, per il quale e;=2 si dice ramificato (nell’esten- 


sione K). Se €; =>2z per qualche 7 i, anche il numero primo p si dice ramificato nel 
campo K. Il numero e; si dice indice della ramificazione );. Analoghe defini- 
zioni si dànno nel caso relativo. 

Se B= A[x], dove x è una radice del polinomio irriducibile f(X)e A[X] 
con coefficiente direttore 1, e yCA è un ideale primo, la decomposizione del- 
l'ideale )B in B è parallela alla decomposizione f(X)=f(X)modye A4/y[X]. 


Più precisamente se f(X)= Il P;(X)% è la decomposizione in fattori irriduci- 
bili, allora yB— Tre p&, dove p;=)B+P;(a)B. 


Ad esempio nol campo Q(€), dove È è una radice primitiva di ordine m del- 
l’unità, sono ramificati esattamente i divisori di m. Se d non divide m, allora 
d=%1 +09 N(6;)=p' per ogni è, dove j è un numero intero minimale per il 
quale pi=1modm, g=9(m)/f. 

Si dice ideale frazionario nel campo K un sotto A-modulo a CK tale che 
cacA per un opportuno ce K*. Gli ideali frazionari costituiscono un gruppo, 
generato in maniera libera dagli ideali ) dell’anello A. 


3.3. Differente e discriminante. 


Siano AcB gli anelli dei numeri algebrici interi di KCL. Posto B'= 
= {be L| Trr,x(bB)CA}, si può dimostrare che B' è un ideale frazionario di 
L. Il suo inverso B'-! si dice differente (relativo) del campo L su K; è un ideale 
di A. La norma del differente del campo X su Q, moltiplicata per (—1)#-b/2, 
n= [K : Q], si dice discriminante del campo K; è un numero intero dy. 

Il discriminante del campo K consiste esattamente di quei numeri primi 
che sono ramificati in quel campo. Il discriminante del campo Q(e?ri?”") è 
uguale al +pr9l@”)-p", 
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Il discriminante è il più semplice e il più importante invariante del campo 
dei numeri algebrici. L’unico campo che ha come discriminante l’unità è Q; 
un’altra formulazione dello stesso risultato è la seguente: il campo Q non ha 
estensioni non ramificate non banali. Questo risultato è analogo in teoria dei 
numeri al fatto che il gruppo fondamentale della sfera di Riemann è banale. 
Inoltre, esiste soltanto un numero finito di campi con dato discriminante (Min- 
kowski). 

Campi diversi da Q possono avere estensioni non ramificate ed anche di 
ordine qualsiasi (Golod-Safarevit). Esempi di tali campi: Q(V—=30030) e 
Q(V 9699690). 

Tuttavia l’estensione abeliana massimale non ramificata di un campo K è 
sempre finita e il suo gruppo di Galois è canonicamente isomorfo al gruppo delle 
classi di ideali del campo (Hilbert). 


3.4. Unità e regolatore. 


Le unità del campo K sono gli elementi invertibili del suo anello dei numeri 
algebrici interi. Esse costituiscono un gruppo abeliano. La sua torsione è finita 
ed è costituita dalle radici dell’unità che appartengono al campo K. Il suo rango 
è uguale a r-1=7,+rg—1, dove 7) è il numero delle diverse immersioni di 
K in R mentre r, è il numero delle diverse coppie di immersioni complesse 
coniugate di KX in C. Un invariante più sottile del gruppo delle unità è il rego- 
latore. Si scelgano r—1 immersioni c; : K-+C (una per ogni coppia di com- 
plessi coniugati) e i generatori 1, ..., vu, del gruppo delle unità rispetto al mo- 
dulo di torsione. Sia N;= 1, se c;(K) CR, N;=2 in caso contrario. Il deter- 
minante det(N;logc;(u;)) non dipende da tale scelta e si dice regolatore del 
campo K. 


3.5. Gruppo di classi e numero di classi. 


Tutti gli ideali frazionari del campo K costituiscono un gruppo I, gli idea- 
li frazionari del tipo a A, ae K costituiscono il suo sottogruppo I, degli ideali 
principali; il quoziente 9/9, si dice gruppo delle classi di ideali del campo K. 
È un gruppo finito; il suo ordine si dice numero di classi del campo K. 


3.6. Funzione zeta e relazioni fra il discriminante, il regolatore e il numero 
di classi. 


Ad ogni campo di numeri algebrici X si può associare la sua funzione zeta di 
Dedekind, che generalizza la costruzione di Eulero del campo Q. Precisamente, 


x 


si ponga tl = Lr dove la sommatoria è estesa a tutti gli ideali a del- 
a 


l’anello degli interi del campo K. Questa serie converge per ogni numero com- 
plesso s con parte reale Re s>1 e può essere prolungata in maniera meromorfa 
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su tutto il piano complesso della variabile s. Nella sua regione di convergenza 
è valido un analogo del prodotto di Eulero: {x(s) =][(1--N(9)*)1, dove y è 
un qualunque ideale primo dell’anello A. db 

. La funzione zeta contiene molte informazioni aritmetiche sul campo XK. 

Ci si limita qui a formulare il seguente, classico, risultato: nel punto s=1 la 
funzione {x (s) ha un polo del primo ordine e in esso il residuo è uguale a 
(2°xt"2r"2Rh)/mV]d| dove R è il regolatore, 4 il numero di classi, 4 il discrimi- 
nante e 7 il grado del campo. 

Questa formula conduce a conseguenze particolarmente importanti nei ca- 
si in cui il residuo di Zx(s) si può calcolare immediatamente, senza rivolgersi 
agli invarianti aritmetici del campo K. Poiché m e d, nei casi concreti, si cal- 
colano senza difficoltà, la formula costituisce una relazione fra R e 4. 

Ad esempio sia K l’estensione quadratica del campo Q con discriminante D. 
Ad essa è naturale porre in corrispondenza un carattere quadratico rispetto al 
modulo |D|, vale a dire l’omomorfismo di gruppi x: (Z/|DI)*>(F1). Se 
D<o, vale a dire K è un campo quadratico complesso, allora 7;=ry=0, R=1, 
e un calcolo diretto del residuo della funzione zeta conduce a una formula per 


; . - > I 

il numero di classi del tipo 4= “Dj Y y(x)x. Se D>o, allora il rango del 
SELE (a, DI=1 : 

gruppo delle unità è uguale a 1 e scegliendo il suo generatore rispetto al mo- 

dulo di torsione («unità principale») e>1, si ottiene un'identità del tipo 


._TTX 
hloge=— Y  y(x)logsin =. 
ansi D 
0<%<(D/2) 
Quest'ultima formula può essere reinterpretata come segue: il numero 
resin i” 
D D 
la, ASit 
rsin 2 
D 
come si può verificare, è un’unità del campo K ee=n?. In altri termini, a meno 
di un fattore inessenziale, il numero di classi di un campo quadratico reale 
coincide con l’ordine del quoziente di tutte le sue unità rispetto al sottogruppo 
generato dalle unità costruibili n. 

Un analogo risultato ha luogo per il campo K=Q(€+€), dove € è una 
radice primitiva d’ordine primo / dell’unità. Qui i 9,= sinar/!- (sinn/2)1 
(numeri) sono unità reali positive costruibili del campo e il numero di classi 
è uguale all'indice del sottogruppo da esse generato nel gruppo di tutte le unità 
reali positive del campo. 

, Questi risultati sorprendono già per il fatto di stabilire un’uguaglianza fra 
gli ordini di due gruppi (il gruppo di classi e il quoziente delle unità), senza che 
i due gruppi siano isomorfi (essi in effetti non sono sempre isomorfi, come mo- 
strano le tabelle). A volte tuttavia, utilizzando l’azione del gruppo di Galois 
del campo X, si può stabilire un isomorfismo fra opportune componenti di 
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questi gruppi e ciò conduce a risultati molto avanzati. Questi problemi costi- 
tuiscono l’oggetto della moderna teoria di Iwasawa e di ulteriori, a volte ipo- 
tetiche, generalizzazioni. 


3.7. Gruppo di Galois e aritmetica. 


La più semplice informazione sui legami del gruppo di Galois con gli ideali 
primi è fornita dal seguente risultato. Sia KCL un'estensione finita di Galois 
con gruppo G, ACB i corrispondenti anelli dei numeri interi, yeA un ideale 
primo. Allora yB= (p1...py)}, dove p; sono ideali primi sui quali il gruppo G 
agisce transitivamente. In particolare i sottogruppi stazionari Gy, degli ideali 
|; sono a due a due coniugati. Il gruppo G}, agisce naturalmente sulla estensione 
dei campi finiti A/yB/p,. Sia I,,CG), il sottogruppo normale degli elementi 
che vi agiscono in maniera banale. Allora il quoziente G,,/Ip, è isomorfo al 
gruppo completo di Galois dell'estensione A/y;jCB/f:. Quest'ultima è genera- 
ta dall’automorfismo (relativo) di Frobenius D,,:x>xN(). Ciò permette di 
considerare D,, come un elemento del gruppo Gy,/Iy,, Se l'ideale ) non è 
ramificato nel campo L, allora tutti i sottogruppi /, sono banali e si ottiene 
una classe di elementi coniugati Dy = (classe D,,) nel gruppo G= Gal(L/K). 
In tal modo a ogni ideale non ramificato in L del campo K si associa la sua 
classe di Frobenius ®Dy CG. Se il gruppo di Galois G è abeliano, i ®, sono sem- 
plicemente gli elementi di G. In questo caso Dy si denota spesso (9, L/K) e 
si dice simbolo di Artin. Si indica con /(9) il gruppo degli ideali frazionari del 
campo K, mutuamente primi, con differente D, dell'estensione L/K e si estende 
il simbolo di Artin a un omomorfismo di Artin dei gruppi /(D)-+G rispetto al 
prodotto: a (a, L/K), dove (my, L/K)=T(h L/R)Y%. 


3.8. Teoria dei campi di classi. 


Il risultato principale della teoria dei campi di classi è la dimostrazione che 
l’omomorfismo di Artin /(D)+G è suriettivo e la descrizione del suo nucleo in 
termini del campo L. Insieme alle proprietà funtoriali di questo omomorfismo 
(rispetto a L, ma anche rispetto a X), questo risultato permette di dare una 
descrizione, sorprendente per bellezza e completezza, del gruppo di Galois del- 
l'estensione abeliana massimale G®= Gal(K°°/K) d’ogni campo di numeri al- 
gebrici K. Senza soffermarsi sui dettagli, si formulerà qui il risultato conclusivo. 

Si consideri il gruppo topologico (R*)"1 x (C*)Y2x]]K} dove y varia negli 


ideali primi del campo K, K$ è il completamento y-adico di K. Si denoti con 
Fx il sottogruppo costituito dai vettori infiniti (ae R*"1 x C*?, aye K$) tali 
che ay sia un’unità }-adica per ogni }), eccetto un numero finito. Il gruppo Fk 
si dice gruppo degli adeli del campo K. Si ha l'immersione canonica K* 7g: 
su ogni componente essa corrisponde all’immersione del campo K nel suo 
completamento topologico R, C oppure X, rispetto a una metrica. Il quoziente 
Cx=x/K si dice gruppo di classi degli adeli del campo XK. Come gruppo 


PIFESRORITI 
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topologico non è limite proiettivo di gruppi finiti, come deve essere un gruppo 
topologizzato secondo Krull: ciò è dovuto alla presenza di una componente 
connessa dell’unità CyCCx che proviene dal sottogruppo R*"1xC*2C7,. 
Il quoziente rispetto ad essa Cy/C4; è già profinito e il teorema fondamentale 
della teoria dei campi di classi è costituito dalle seguenti affermazioni: 


a) Tutti gli omomorfismi di Artin si «incollano» in un omomorfismo 
Fx >Gal(K°/K); questo omomorfismo è suriettivo. 

5) Questo omomorfismo induce un isomorfismo C'x/CYj+ Gal(K/K)= G®. 

c) Il sottogruppo #x corrispondente agli elementi di G®2 che lasciano fissa 
un'estensione abeliana finita L/K, è uguale a K* N,,g Jr (non ci si 
soffermerà a definire l'applicazione Ny,x : 7, -* Lx, abbastanza evidente). 


Tutti gli oggetti che figurano in questa descrizione possono essere cal- 
colati molto chiaramente nel caso K=Q, grazie al classico teorema di Kronek- 
ker-Weber per cui il campo Q°° coincide col campo generato su Q da tutte le 
radici dell’unità. Da qui segue l’isomorfismo canonico G@=lim(Z/mZ)*, li- 

Cs 
mite rispetto al sistema proiettivo degli interi 71 con la relazione d’ordine m, > #1, 
se m; è divisibile per 1, che determina un omomorfismo di restrizione rispetto 
al modulo 77, : Z/m,Z+Z/myZ. Questo limite è isomorfo a [25 (Z$ è il gruppo 


delle unità p-adiche), e non è difficile identificare quest’ultimo gruppo con 
CalCè. 

Nel caso di un campo generale K, le dimostrazioni della teoria dei campi di 
classi sono eccessivamente indirette e basate, grosso modo, sul confronto degli 
ordini dei gruppi quoziente finiti Cx/N7,x(Cz) e Gal(L/K) per le variabili 
K e L. La presenza dell’omomorfismo di Artin e di disuguaglianze fra questi 
ordini, da diversi lati permette alla fine di stabilire l’isomorfismo cercato. Le 
valutazioni degli ordini nei gruppi di adeli sono basate su calcoli y-adici locali, 
nei gruppi di Galois in esplicite costruzioni di estensioni abeliane per mezzo 
dell'aggiunta delle radici dell’unità e quindi di radici di elementi del campo. 
In effetti un metodo banale per costruire un campo, che evidentemente contiene 
K®, consiste nell’aggiungere a KQ?=| JK (emi) tutte le radici degli elementi 

m 


di KQ°. Tuttavia questa estensione non è abeliana e la descrizione della sua 
sottoestensione abeliana massimale, o almeno del gruppo di Galois di quest’ul- 
tima, non è affatto banale. Il secondo problema, come si è visto, è già stato ri- 
solto, ma il primo rimane, insieme alle generalizzazioni non abeliane della teo- 
ria dei campi di classi, uno dei problemi fondamentali dell’aritmetica dei nu- 
meri algebrici. 


3.9. Teoria locale dei campi di classi. 


In tutta l'esposizione precedente si è rimasti su un punto di vista globale; 
il risultato del $ 3.8 conduce a pensare che la considerazione di completamenti 
locali del campo X,, del gruppo dei suoi adeli 7x, ecc. fin dall’inizio si sarebbe 
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rivelata più utile. In effetti questo punto di vista è oggi quello principale. La 
sua realizzazione successiva è legata in primo luogo ai nomi di Chevalley, Artin e 
Whaples, Tate, Weil, Eichler, Ono, Tamagawi. In questo punto ci si limita a 
formulare il teorema fondamentale della teoria locale dei campi di classi per i 
campi del tipo K,. Esso afferma che esiste un isomorfismo canonico fra il grup- 
po Gal(K®/K,) e il completamento del gruppo K$ nella topologia di Krull. 
A «livello finito » il gruppo di Galois di un’estensione abeliana finita XK, CL, è 
canonicamente isomorfo al gruppo quoziente K#/N ry&y (23). 


3.10. Il problema di una costruzione esplicita delle estensioni abeliane. 


Oltre al teorema di Kronecker-Weber, questo problema è risolto per le 
estensioni quadratiche immaginarie K del campo Q nella classica teoria del 
prodotto complesso di funzioni ellittiche, che rimane un modello per ulteriori 
ricerche. 

L'idea della costruzione consiste nel considerare le radici dell’unità come 
punti d’ordine finito su un gruppo algebrico moltiplicativo G, e quindi sosti- 
tuire G,, con un opportuno gruppo algebrico Xy, legato al campo K, nella 
speranza che l’aggiunta a X dei suoi punti d’ordine finito fornisca K® o per lo 
meno una sottoestensione abbastanza grande di 2, 

Per i campi quadratici immaginari K quest'idea si realizza nel modo se- 
guente. L’anello dei numeri interi A di questo campo reticola il piano complesso 
C. L’insieme delle funzioni meromorfe su C, periodiche rispetto a questo re- 
ticolo, costituisce il campo delle funzioni ellittiche su una riemanniana alge- 
brica. La curva algebrica corrispondente può essere data dall’equazione di 
Weierstrass y?=4x3—g,x—g3. Il suo invariante j=1728gî(gì—27g3)* è un 
numero algebrico intero determinato a meno di coniugio sul campo K. Il primo 
risultato della teoria del prodotto complesso consiste nel fatto che K=XK(j) è 
un'estensione abeliana non ramificata massimale del campo X, cioè il cosiddetto 
campo di classi di Hilbert. Dal teorema fondamentale dei campi di classi ($ 3.9) 
si deduce che il suo gruppo di Galois è isomorfo al gruppo delle classi di ideali 
del campo K. Si aggiungano ora a K le coordinate di tutti i punti d’ordine 
finito sulla curva ellittica con invariante j descritta sopra. Il risultato coincide 
col campo K®. L’azione del gruppo di Galois G°, rappresentata dai simboli di 
Artin, su j e sulle coordinate dei punti d’ordine finito, si può pure descrivere in 
maniera completamente esplicita, in analogia alla descrizione dell’azione di 
Gal(Q/Q) sulle radici dell’unità. 

Recentemente Lubin e Tate hanno dimostrato che un analogo di questa 
costruzione sussiste per ogni campo locale K. A questo scopo occorre sostituire 
la curva ellittica con un gruppo formale. Sia A l’anello dei numeri interi del 
campo K. Un gruppo formale (più precisamente una legge gruppale formale) 
su A è una serie formale di potenze F(X,Y)c A[X,Y] con le seguenti pro- 
prietà: a) F(X, F(Y,Z))=F(F(X,Y),Z), b) F(X,Y)= F(Y,X), F(X,0)=X. 
Sia mc A un ideale massimale. Per mezzo di F si può introdurre in esso una 
legge di composizione *: x*y= F(x,y). Rispetto a questa legge di composi- 
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zione si trasforma in un gruppo abeliano (in effetti è addirittura un gruppo di 
Lie su K). 

Ad esempio se F(X, Y)=X+ Y+XY, questo gruppo è soltanto (1+m)*. 

Si dice endomorfismo di una legge formale Y una serie fe A[X] tale che 
F(F(X,Y))= F(/(X), f(Y)). Un’applicazione f:im-+m definisce in questo ca- 
so un endomorfismo del gruppo (im, *). 

Sia g= Card A/m, x un generatore dell’ideale m. Esiste allora un’unica 
legge gruppale F,, per la quale f(X)=xX+.X? sia un endomorfismo. Si tratta 
dell’endomorfismo di prodotto per x. 

Si denoti con L l'estensione del campo K generata a) da tutte le radici del- 
l’unità di grado primo con g; b) da tutti i punti x” secondo l’ordine del gruppo 
definito dalla legge /_, vale a dire dalle radici dei polinomi f(f...(f(X))...). 
Allora L è l'estensione abeliana massimale del campo locale XK. L’azione di K* 
su essa si può descrivere esplicitamente grazie all’isomorfismo di Gal(L/K) 
con K*, come nella teoria classica del prodotto complesso. 


3.11. Ulteriori idee. 


A causa delle dimensioni limitate di questo articolo si sono dovute lasciar 
da parte molte idee che si trovano al centro dell’attenzione degli studiosi mo- 
derni. Fra queste rientrano, in particolare, i problemi di calcolo della coomo- 
logia dei gruppi di Galois di campi globali e locali; la descrizione delle rappre- 
sentazioni dei gruppi di Galois, in particolare sulle varietà algebriche di coomo- 
logia /-adica; le connessioni di queste ultime con le funzioni zeta e con le forme 
automorfe e il programma di Langlands» di costruire una teoria non commu- 
tativa dei campi di classi; il ruolo della K-teoria algebrica nell’aritmetica con- 
temporanea [si vedano a questo riguardo Langlands 1974; Tate 1974]. 


4. Numeri trascendenti. 


4.1. Il problema della trascendenza o dell’indipendenza algebrica. 


In questo paragrafo si darà un cenno sulla dimostrazione del teorema da 
cui deriva la trascendenza dei numeri e, t e xf (x340, 1 numero algebrico, f 
numero irrazionale algebrico). 

Il problema della trascendenza di «8 fu posto da Eulero e incluso da Hilbert 
nel suo famoso elenco di problemi (1900). Esso fu risolto indipendentemente 
da Gel'fond e da Schneider (1934) dopo lavori anticipatori di Gel'fond del 
1929. Qui viene seguito Lang [1966], il quale ha semplificato e generalizzato la 
dimostrazione di Gel'fond e Schneider. In conclusione è riportato un elenco 
del tutto incompleto di altri risultati e problemi. 

L'idea comune alla maggior parte dei metodi dimostrativi della trascen- 
denza o dell’indipendenza algebrica di numeri concreti e di funzioni è legata 
alla loro rappresentazione sotto forma di valori di funzioni analitiche, la cui 


ì 
ì 
i 
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trascendenza e indipendenza algebrica sono incomparabilmente più semplici 
da determinare. Dopo di ciò si costruiscono alcune funzioni analitiche ausiliarie: 
i loro valori sono maggiorati con considerazioni analitiche e si dimostra che que- 
ste maggiorazioni contraddicono valutazioni aritmetiche dal basso, che si ot- 
tengono con considerazioni aritmetiche, se i numeri originari sono algebrici. 
Le valutazioni dal basso, in ultima analisi, sono legate semplicemente al fatto 
che un numero intero non nullo ha sempre modulo > 1. 

Una funzione algebrica (eventualmente plurivoca) f(z) della variabile com- 
plessa # possiede le seguenti proprietà: 


4) per prosecuzione analitica, f assume un numero limitato di valori in ogni 
punto, vale a dire ha un numero finito di fogli. 
b) f assume ogni valore prefissato in un numero limitato di punti. 


c) meli(a)i<R per R>R, e # opportuno. 
Izi= 


d) f non ha singolarità essenziali. 


Pertanto, per dimostrare la trascendenza della funzione f(z) è sufficiente 
verificare che non vale una delle proprietà elencate. Ad esempio e? è trascen- 
dente poiché e#= 1 per ogni ze 2777Z (non vale la b)), e anche poiché ef cresce 
più velocemente di qualsiasi potenza di R (non vale la c)). La funzione log= 
è trascendente perché non vale la condizione a). 

Le funzioni e%?,..., e** sono algebricamente indipendenti, se «1, ..., &n 
sono numeri linearmente indipendenti su Q. In effetti, considerando per sem- 
plicità che a; sia reale, si supponga che sussista una relazione polinomiale fra le 
ex, Sarà della forma Zam, my@i%t.+2n%n)=0. Dall'indipendenza lineare 


su Q degli x; segue che tutti i numeri x mje; sono diversi e non uguali a zero 


per (1) (0). Si scelga fra questi il massimo, sia v. L'elemento 4, mE sarà 
dominante nella somma per ze R, v3+ co e non può essere ridotto. con “gli ele- 
menti rimanenti: contraddizione. 

La maggior parte delle dimostrazioni necessarie per. le applicazioni alla 
indipendenza trascendente di funzioni non sono essenzialmente più compli- 
cate di questa, benché i dettagli tecnici possano complicarsi. 


4.2. Funzioni con ordine di crescenza finito. 


Per la formulazione del teorema sulla trascendenza occorrono i seguenti 
concetti. Una funzione intera è una funzione analitica (univoca) f: C+C. 
Una funzione intera f ha ordine di crescenza < p se esiste una costante C>I 
tale che per |2|< sia verificata la valutazione |f(2)} <C®? per ogni R abba- 
stanza grande. Una funzione meromorfa di ordine < p è il rapporto di due fun- 
zioni intere di ordine < g. 
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4-3. Formulazione del teorema e sue conseguenze. 


fu» +» fy siano funzioni meromorfe con ordine di crescenza finito, compren- 
denti due funzioni algebricamente indipendenti. Si supponga che le f; sod- 
disfino un sistema di equazioni differenziali del tipo df;/de=P;(f-fx), 
dove P, è un polinomio a coefficienti algebrici, = 1,...,N. Allora il numero dei 
punti w;€ C (esclusi i poli delle funzioni f;) nei quali tutte le funzioni f; as- 
sumono valori in un dato campo X, [K : Q]< 00, è finito. 

Supponendo f, = 2, fa = e”, si trova che il numero e* è trascendente se x40 
è algebrico. In effetti, altrimenti, dal campo K=Q(a,e%) si otterrebbe che f, 
e fs assumono valori di K in un insieme infinito di punti a, 2a, 3a, ... In parti- 
colare è trascendente il numero x, poiché eri= 1 è algebrico. 

Supponendo f,=e®, f,= e, dove f è un numero algebrico irrazionale, si 
ha che af=e8!082 (dove a340,1 è algebrico) è un numero trascendente: al- 
trimenti f, e fa assumerebbero valori algebrici in un campo di grado finito in 
tutti i punti mloga, m>1. L'indipendenza algebrica di f, e f, segue dall’ir- 
razionalità di f}, vale a dire dall’indipendenza lineare fra 1 e B su Q. 

Si osservi ancora che il numero dei punti in cui le f; possono assumere va- 
lori di un dato campo K, si può valutare esplicitamente nelle ipotesi del teorema: 
se K contiene i coefficienti dei polinomi P,, e gli ordini di f; non superano g, 
questo numero è < 209[K : Q]. 


4.4. Componenti aritmetiche della dimostrazione. 


La dimostrazione è basata sulla costruzione di funzioni analitiche ausiliarie, 
soggette a condizioni lineari e connesse all'insieme di punti nei quali le f; as- 
sumono valori algebrici. 

Nella costruzione delle funzioni ausiliarie svolgono un ruolo importante i 
lemmi sulla soluzione delle equazioni lineari, applicati per la prima volta da 
Siegel ad analoghe questioni. 


a) Valutazioni su Q. Sia (a;;) una matrice intera con 7 ARIE e n colonne, 


n>r, |a;;]<B. Si consideri il sistema di equazioni lineari x a;;x;=0: esso ha 
soluzione intera non nulla con |x;| <2(nB)/®-?}, j= 1,...,1.9 
Da dimostrazione procede nel modo seguente: il numero dei vettori (y;) con 


it d;;%;, |x;] < (nB)/-?, è maggiore del numero dei vettori tali che |y,] < 


+ [a;;l|x] <nB(nB)Y®-”. Pertanto ogni coppia di vettori distinti (x;), (x) 
fornisce lo stesso valore (y i) e la loro differenza dà una soluzione non nulla del 


nostro sistema di equazioni. 


b) Valutazioni su K, [K :Q]<%. Si consideri lo stesso problema del 
punto a), però con 4;;€ A, essendo A l’anello dei numeri interi del campo K. 
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Se SCK, poniamo [S|] = max|gs|, se .S, ge {immersioni di K in C}. Se [((2,,)|< 
<B esiste una soluzione del sistema di equazioni del punto a) con x;e 4 e 
e;|| <C1(C,nB)/#-P, dove C, e C, sono opportune costanti, dipendenti solo 
da K. Per la dimostrazione occorre decomporre 4;;, x; rispetto a una base fis- 
sata di A su Z e applicare il risultato precedente insieme a evidenti valutazioni 
di ||S| per mezzo di |.S]. 


c) Valutazione di ||P|, dove P è un polinomio nelle f;. Sia SCK; se BeZ, 
B=>o è un numero intero tale che BSCA, si dice che B è il denominatore di S 
e si denota ogni denominatore di S con den S. f,, ..., fy siano funzioni olomor- 
fe nell'intorno di un punto weC e f;(w)eK, i=1,..., N; sia dfJd== Pf 
fx), Pie KIT, -., Ty]. Sia infine Pe K[T,, ..., Ty] un polinomio di grado 
<r, f=P(fw fx), |P||= |{(coefficienti di P)|. Allora per ogni intero K>o 
valgono, con una opportuna costante C4, le valutazioni seguenti: 


k 
2 f(0)]|<NPIricH» 


& 
min den < (w)<den(P)- Ck 
dz 


Questo risultato si dimostra per induzione non complicata rispetto a f. 


4.5. Costruzione delle funzioni ausiliarie. 


Sotto le ipotesi del $ 4.2 si scelgano m punti W; nei quali fi(w;)e K (i 
coefficienti dei P,e K). Una maggiorazione di m si ottiene da valutazioni op- 
poste per i valori della funzione ausiliaria e delle sue derivate nei punti w;. Si 


e 

scelga come F il polinomio F= )' bi; figî, dove Sge{f fw} sono alge- 

tjol MNSETICI sap 

bricamente indipendenti. Come r si prenda un numero divisibile per 21; più 

avanti lo si renderà molto grande. S’impongano inoltre le seguenti condizioni ai 
k 


d ” 
coefficienti di F: a) b;;c A; b) [b;;| <a; c) af @;)=0 per 1</j<M, IS 


<k<n. Le valutazioni del $ 4.2 permettono di mostrare l’esistenza di (0) # (0) 
con queste proprietà, se 7=7%/27 per un’opportuna costante C. Per essi Fao, 
giacché f e g sono algebricamente indipendenti. 


4.6. Valutazione dei valori delle derivate di F. 
._ {d5F d'F : 
Sia (776) #(0) ma (0) = (0) per /<s—1. Allora s>n e si può 


LI . . 
ritenere che y= af (0;) #0. Il numero s tende a co insieme a r. In forza del 


di 
$ 4.4, c), esiste un numero intero ce Z, o<c<CCî, tale che ced 5 xl] Cs55. 


Allora 1<|Ng,jo()| < CHUE: 1-1 spy]. 
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9g intere. Allora 9°"F è una funzione intera e G(2)=9(2)7.F.[[(3-%,)f è 


D'altro lato esiste una funzione intera 8 di ordine < p con 9(w0,)40 e 2f, 
Mm 


s vel 


i VENE: d 
una funzione intera. Il valore G(7,) differisce da Y=7aF (2) per un fattore 


limitato dalla quantità Cîs/ D'altro lato |G(w,)|<max]HM(2)} se R>|w. 
Izi=>R 


Prendendo x abbastanza grande, ad esempio s, e quindi ponendo R=5!?20, si 


ottiene senza difficoltà la valutazione C$ - s6î4-(/26)1 per max]H(2)|. 
\zi=R 
Confrontando la maggiorazione che ne deriva per v con la valutazione dal 
basso al termine del precedente paragrafo si ottiene una contraddizione se 
m>zop[K :Q]; ciò dimostra il teorema. 


4.7. Ulteriori risultati e problemi. 


a) Il teorema di Gel'fond e Schneider sulla trascendenza di af può essere 
riformulato come segue: se «, } sono numeri algebrici non nulli e loga, logf 
sono linearmente indipendenti su Q, allora sono linearmente indipendenti su 
Q. Alla fine degli anni ’60 Baker, sviluppando il metodo di Gel'fond e Schnei- 
der, mostrò, per ogni n=2, che se a, ..., &, sono numeri algebrici non nulli e i 
loro logaritmi sono linearmente indipendenti su Q, allora sono linearmente indi- 
pendenti su 0. 

Un analogo risultato, con l’esponenziale al posto del logaritmo, era stato 
stabilito da Weierstrass nel 1855. 

b) Esistono numerosi risultati relativi all’approssimazione di numeri tra- 
scendenti noti per mezzo di numeri algebrici. 

Sia € un numero algebrico; si denoti con H(É) il massimo modulo dei coef- 
ficienti di un polinomio irriducibile di cui È sia una radice. Allora per ogni e>o 
vale la valutazione 
loga 
logB 


per H>H;(a,,e,[Q(e) : Q]) (Gel’fond, 1949). Baker e Feldman hanno esteso 
queste valutazioni alle forme lineari di più logaritmi. 

c) Molta attenzione è stata posta al problema della trascendenza dei valori 
di funzioni speciali, legate all’uniformizzazione delle varietà algebriche. Ad 
esempio Schneider ha dimostrato che data la curva ellittica y?=x8—gyx—g,, 
£» © 23 algebrici, i punti algebrici P su di essa hanno argomenti trascendenti di 
Weierstrass {£(dx/y). Analoghi risultati valgono per le funzioni di Bessel, ecc. 

d) Schanuel ha formulato la seguente ipotesi: se i numeri a,, ..., «, sono 
linearmente indipendenti su Q, fra i numeri %1, +», Xpy €%1, ..., €*n ve ne sono un 
numero = n algebricamente indipendenti su Q. Recentemente Cudnovskij ha 
mostrato che per insiemi opportuni (21, ..., &,), 1> 0, la quantità di numeri al- 
gebricamente indipendenti fra (a,, ...,0,; €%, ..., e%) tende all’infinito. [Ju.1.M.]. 


>exp(—|log 7|?+5) 
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I termini si riferiscono in primo luogo a numeri e a funzioni (cfr. numero, funzione, 
divisibilità) e forniscono una classificazione legata, in un certo senso, alla loro complessità 
(cfr. semplice/complesso). A partire dal concetto di numero e di figura geometrica (cfr. 
geometria e topologia, curve e superfici, matematiche) la storia di questa classifi- 
cazione (cfr. sistematica e classificazione) si sviluppa attorno alle idee fondamentali 
di linguaggio algebrico per rappresentare numeri e operazioni (cfr. applicazioni, rap- 
presentazione), di interpretazione dei numeri come misura, di loro applicazione ai 
problemi dell’infinito (cfr. anche continuo/discreto, insieme). Oggi costituiscono un 
capitolo importante dell’algebra (in cui si riferiscono a elementi delle principali strutture 
matematiche) e della teoria (cfr. teoria/modello) dei numeri, in cui s'impongono pro- 
blemi di dimostrazione della trascendenza di varie classi di numeri (cfr. anche deduzio- 
ne/prova, dipendenza/indipendenza) o di approssimazione mediante numeri di 
classe inferiore. 


Simmetria 


La prima parte di questo articolo è costituita da osservazioni sulla storia del 
principio di simmetria; essa contiene anche una descrizione delle sue applica- 
zioni alla fisica moderna. Nella seconda parte vengono esposte in maniera fram- 
mentaria nozioni introduttive sul principale apparato matematico della teoria 
della simmetria: i gruppi e le loro rappresentazioni. La materia è talmente ampia 
che perfino il semplice tentativo di denominare i temi che le sono collegati non 
è possibile; si veda anche l’articolo « Dualità» in questa stessa Enciclopedia che 
sostanzialmente è dedicato a un aspetto della simmetria. 


1. Nozioni generali. 


1.1. Osservazioni storiche. 


La parola greca ciupetpog denota ‘commensurato, proporzionale’. Euclide 
utilizza questa parola in relazione ai segmenti commensurabili, cioè i segmenti 
il rapporto delle cui lunghezze è razionale (cfr. l’articolo « Razionale/algebrico/ 
trascendente » in questa stessa Enciclopedia). i 

Hermann Wegyl, all’inizio della prima lezione del suo Symmetry [1952], scri- 
ve che «la parola tedesca Ebenmass è un ottimo equivalente della parola greca 
“simmetria”: entrambe esprimono anche l’idea di ‘misura mediana , il giusto 
mezzo al quale dovrebbero tendere nelle loro azioni gli uomini virtuosi secondo 
l’etica nicomachea di Aristotele, e che viene descritto da Galeno nel De tempe- 
ramentis, come lo stato d’animo ugualmente distante dai due estremi: odupuetpov 
Brep Exatépov Tév dixpuwyv drteyet» (trad. it. p. 10). i i l 

Nel trattato di Aristotele Del cielo si attesta un'antica considerazione di filo- 
sofia della natura per cui l’idea di simmetria è utilizzata in considerazioni cosmo- 
logiche vicine per spirito ai modelli moderni dell'Universo omogeneo. Scrive 
Aristotele: «Se nulla fa sf che questo [il moto della Terra] sia piuttosto verso il 
basso che verso l’alto, e se l’aria che sta sopra non impedisce il moto verso l’alto, 
neppure quella che si trova sotto la terra impedirà il moto verso il basso. È ne- 
cessario infatti che le medesime cause provochino nelle stesse cose eguali effetti» 
[2952, 26-29]. l l na 

Questa idea di simmetria, che nella traduzione russa diventa nono6ne simi- 
larità’ (nell’originale greco dà Thv duowornta), è riferita ad Anassimandro se 
condo la seguente rappresentazione del mondo. La Terra si trova al centro d'un 
involucro sferico di fuoco, senza appoggiarsi su alcunché: non c’è bisogno di 
appoggio, giacché a causa della simmetria sferica la Terra non ha alcun motivo 
di muoversi in alcuna direzione. Per noi è difficile valutare tutta l'originalità che 
questa concezione aveva quando fu elaborata per la prima volta: la 'T'erra non 
era sostenuta da una tartaruga, ma dalla logica. Fra l’altro la Terra stessa, per 
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Anassimandro, non aveva forma sferica, ma di cilindro circolare la cui altezza 
era tre volte minore del diametro della base. Però in questo modo la direzione 
della verticale rompe chiaramente la simmetria totale dell'Universo. 

L’idea che «la conseguenza non può essere meno simmetrica della causa» 
sorse nel xx secolo sotto il nome di principio di Curie. Probabilmente è un ca- 
so particolare di qualche archetipo di pensiero teoretico: in Anassimandro, ad 
esempio, è ancora chiara la sua connessione genetica con quel che, più tardi, 
sarà detto «principio di ragione sufficiente» (si veda l’allegoria dell’asino di Bu- 
ridano). Negli ultimi anni, nella fisica teorica, ha acquisito un significato parti- 
colare la concezione di «rottura spontanea della simmetria». Situazioni in cui 
«la conseguenza è meno simmetrica della causa» si verificano in un’ampia classe 
di modelli teorici. Il meccanismo di rottura della simmetria può essere un’insta- 
bilità particolare dello stato simmetrico in relazione a qualsivoglia piccola per- 
turbazione esterna. Ciò sarà esaminato in dettaglio in seguito. 

La connessione fra il contenuto del termine ‘simmetria’ e le idee di ugual 
peso e commensurabilità, nella concezione moderna, si è indebolita. La mate- 
matizzazione dell’idea di simmetria ha portato in primo piano la rappresentazio- 
ne di una ripetibilità regolare e quindi d’un gruppo di trasformazioni in sé d’un 
oggetto simmetrico. A questo aspetto della simmetria si riferiscono le idee del- 
l’antichità relative alla classificazione dei poliedri regolari e le loro connessioni 
con gli «elementi» di cui è costituito l'universo. La classificazione dei poliedri 
regolari è esposta da Euclide; il suo autore si pensa essere stato Teeteto. Quat- 
tro elementi, fuoco, aria (etere), acqua e terra, dice Empedocle. Aristotele ag- 
giunse il quinto. Platone avanzò l’idea per cui le differenze fra gli elementi (o 
otoryeîa ‘lettere dell’alfabeto’ [Teeteto, 201d-202€]) si spiegano con la forma 
delle particelle da cui sono costituiti questi elementi: fuoco-tetraedro, aria-ot- 
taedro, acqua-icosaedro, terra-cubo. Per quanto riguarda il quinto poliedro, il 
dodecaedro, «dio se ne giovò per decorare l’universo» [Timeo, 55c]. 

Senza dubbio la teoria di Platone appartiene a un diverso sistema di pensie- 
ro rispetto alle concezioni della scienza naturale contemporanea. Ciò nonostan- 
te nella struttura dei concetti di teoria quantistica dei campi si trovano frammen- 
ti analoghi alle concezioni di Platone. La teoria della simmetria SU (3) (e i suoi 
miglioramenti), che ha condotto alla concezione dei quark, confronta famiglie 
di particelle elementari osservabili sperimentalmente (le «lettere» dell’univer- 
so) con forme geometriche simmetriche di dimensione finita che sono dette 
«diagrammi di peso». Un diagramma di peso è la collezione di un numero finito 
di vettori (o di punti) che non appartengono allo spazio tridimensionale fisico, 
ma a uno spazio astratto di operatori che agiscono nello spazio dei gradi di li- 
bertà interni del sistema quantistico. Questi gradi di libertà (come l’isospin) si 
dicono interni perché non sono legati alla cinematica spazio-temporale, a diffe- 

renza delle coordinate, dell’impulso o del momento angolare. Diagrammi di pe- 
so corrispondenti a certe -ple sono rappresentati, ad esempio, nell’articolo 
«Particella » in questa stessa Enciclopedia, X, pp. 464-65 (cfr. anche $ 2). 

In tempi recenti la storia matematica della simmetria è legata al xIx secolo; 
il tema della simmetria riceve cosî voce autonoma in ritardo; l’analisi dell’infi- 
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nitamente piccolo occupava tutti. Evariste Galois, morto nel 1832, fondò la teo- 
ria della simmetria delle equazioni algebriche in una indeterminata. Da proto- 
tipo utilizzò il lavoro di Gauss sulla teoria dei campi ciclici, cioè, se si vuole, 
dei poligoni regolari piani. Un poligono regolare di x lati possiede una simme- 
tria evidente: si trasforma in sé per rotazioni di angoli multipli di 27:/n attorno 
al centro. Si può anche notare la presenza di x assi di simmetria. La scoperta 
eccezionale di Gauss consisteva nel fatto che per la costruzione di un poligono 
regolare con riga e compasso non era tanto importante questa evidente simme- 
tria, ma un’altra, nascosta. Si rappresentino i vertici del poligono con le radici 
n-esime dell’unità e?ri%/2) sul piano complesso. Si considerino le sostituzioni di 
queste radici (cioè dei vertici) del tipo 0, : e?Ti(#/) | g2milkmin), dove il numero 
o<m<n è intero e primo con n. Risulta g(2)=x[](1-p) (p primo) il nu- 
pin 

mero di sostituzioni, costituenti un gruppo che, nel caso generale, non è conte- 
nuto nel gruppo delle riflessioni e rotazioni. Questo gruppo non conserva la di- 
stanza fra vertici, ma la struttura delle operazioni algebriche di somma e di pro- 
dotto, sull’insieme di tutti i numeri complessi che si possono ottenere dalle ra- 
dici dell’unità applicando queste operazioni. La forma della «simmetria nasco- 
sta» come della «simmetria spontaneamente distrutta» divenne una metafora 
matematica popolare della moderna fisica teorica, 

I lavori di Galois, per motivi storici casuali, rimasero in ombra per molti 
anni. Il successivo sviluppo della teoria della simmetria come teoria dei grup- 
pi e delle loro azioni è legato nella concezione dei posteri ai nomi di Klein, Jor- 
dan e Lie in primo luogo. Il Traité des substitutions et des équations algébriques di 
Jordan, che ebbe tanta influenza, apparve nel 1870. L'atmosfera in cui lavora- 
vano e comunicavano questi tre matematici non soltanto permise la scoperta di 
una grande quantità di fatti matematici nuovi e la sistematizzazione di vecchi, 
ma anche la formazione di un’ideologia. La più nota formulazione di questa 
ideologia fu il programma di Erlangen pubblicato da Klein [1872]. 

Brevemente, Klein inizia a definire il gruppo delle simmetrie di diverse teo- 
rie geometriche (euclidea, proiettiva, della geometria iperbolica). All’inizio que- 
sto gruppo serve da classificatore della teoria, ma in seguito Klein cambia punto 
di vista e propone di considerare che il gruppo, dato insieme alla sua azione sullo 
spazio, definisca in maniera essenziale tutto il contenuto della geometria corri- 
spondente in quanto teoria delle proprietà (delle figure) invarianti per le azioni 
di questo gruppo. 

Nei lavori di Lie (il corso di Lie-Engel è del 1888-93) gli: stessi gruppi di 
trasformazioni di carattere geometrico, compresi quelli a dimensione infinita, 
diventano l’oggetto di studi coi metodi dell’analisi. Parallelamente si sviluppa 
la tecnica del «calcolo assoluto », vale a dire la descrizione dell’analisi locale sulle 
varietà in maniera indipendente dalla scelta del sistema di riferimento. Questa 
tecnica sarà chiamata a svolgere un ruolo importante nella teoria generale della 
relatività di Einstein (1916). L'idea di cambiamento delle coordinate può es- 
sere collegata all’idea di trasformazione di simmetria realizzabile fisicamente, 
ad esempio di boost, che accelera l'osservatore e l’obbliga a condurre le misura- 
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zioni in un sistema inerziale variabile. Allora si pone appieno il problema rela- 
tivo a ciò che non dipende da questo cambiamento («invarianza»), o almeno ne 
dipende in maniera semplice («covarianza»). Questi invarianti e covarianti sono 
essenzialmente leggi fisiche. 

Ma l’idea di cambiamento di coordinate può anche essere collegata global- 
mente alla sfera concettuale. Gli arbitrari cambiamenti di coordinate, differen- 
ziabili e con inversa differenziabile in una regione locale dello spazio-tempo, 
che Einstein considerava nella formulazione del suo «principio generale di rela- 
tività» non corrispondono ad alcuna trasformazione di simmetria fisicamente 
realizzabile. Il «principio generale di relatività) è una richiesta di simmetria ap- 
plicata al linguaggio in cui si formula la legge fisica, molto maggiore della legge 
stessa. Altro affare è che le rappresentazioni intuitive legate a questo principio 
abbiano potuto svolgere, nella storia della scienza, un ruolo poco dipendente 
dal contenuto formale. 

Nella coscienza creatrice l’idea di simmetria si riferisce a una regione limi- 
tata dall’attività sistemica, razionalizzatrice, e alla percezione estetica. Quest’i- 
dea ha la capacità di comprendere attivamente i meccanismi emozionali della 
coscienza. L’arte, che crea strutture spazio- temporali ritmiche, e la scienza, che 
le coglie in un materiale empirico non ordinato, s'incontrano qui su un territo- 
rio comune. Ecco come uno studioso moderno descrive l’Invenzione a tre voci 
in fa minore di Bach: « Nella struttura di questa Invenzione, scritta in contrap- 
punto triplice e distinta da una ricchissima cromaticità, entrano dieci volte un 
tema emergente e tre intermedi, di cui uno compare solo una volta e gli altri 
due, ciascuno due volte... Le cinque comparse dei tre intermedi (1 +2+2)e 
le dieci comparse del tema formano congiunte una simmetria molto rigorosa... 
Ogni intermedio si trova fra due comparse del tema delle quali una è doppia, e 
l’altra semplice, unica... dopo la comparsa di tutti e tre gli intermedi compare 
il secondo e poi il terzo... Con le proprie due comparse il secondo intermedio se- 
para l’Invenzione in tre segmenti omogenei 
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i cui ultimi due sono assolutamente identici, mentre il primo si distingue dai 
due restanti soltanto per un intermedio » [Gerskovié 1979, PP. 44-45]. 

In questo testo la simmetria si rivela come principio formatore. Prendendo 
la teoria matematica della simmetria in una concezione ampia, si potrebbero in- 
trodurre in essa anche quelle concezioni in cui è importante l’idea di genera- 
zione ricorsiva di una struttura complessa per mezzo di un piccolo numero di 
regole. Il recente libro di Hofstadter e altri [1980] è una raccolta eccellente di 
variazioni diverse su questo tema. 
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1.2. Simmetria e leggi fisiche. 


Le forme primitive della simmetria sono suggerite da osservazioni nelle 
scienze naturali. 

Gli oggetti della biologia permettono di distinguere alcuni aspetti di sim- 
metria spaziale di rotazione, che di solito sono funzionali alla crescita dell’or- 
ganizzazione. Una sfera solida è dotata di simmetria rispetto a qualunque rota- 
zione attorno al centro, vale a dire del gruppo SO (3) delle rotazioni nello spazio 
euclideo tridimensionale. Un cerchio solido è simmetrico rispetto alle rotazioni 
piane. Questi due aspetti della simmetria si realizzano approssimativamente per 
alcuni protozoi in sospensione nell’acqua e rispettivamente per protozoi che 
conducono una forma di vita sul fondo. 

Organismi come le stelle marine corrispondono a un gruppo finito di rota- 
zioni piane. Ma più diffusa è la simmetria speculare approssimata degli organi 
esterni, rispetto alla riflessione destra/sinistra. 

È naturale considerare le proprietà di simmetria della forma esterna in con- 
nessione con le caratteristiche delle sue interazioni col mondo esterno: col tipo 
di ambiente in cui abita, col carattere della localizzazione, col tipo di alimen- 
tazione. Un organismo a simmetria destra/sinistra — con eccezione della testa 
sulla quale sono impressi la bocca e gli occhi — è un organismo-vettore, la cui 
struttura è idonea ad essere attiva. 

La simmetria degli organi interni è determinata parzialmente dalla simme- 
tria esterna, ma ammette notevoli eccezioni. Negli ultimi anni si è presa molto 
in esame l’asimmetria funzionale, specifica dell’uomo, delle due metà del cer- 
vello, la destra e la sinistra, la quale è correlata con l’asimmetria funzionale 
delle mani destra e sinistra, ma è relativa a un livello molto più profondo di at- 
tività del sistema nervoso centrale. Secondo Pribram, l’emisfero sinistro elabora 
l'informazione, per molti aspetti in maniera analoga a una calcolatrice nume- 
rica, mentre l’emisfero destro funziona più rapidamente secondo i principî dei 
sistemi ottici e olografici di elaborazione dei dati. 

Nella struttura non viva dei cristalli si trovano, probabilmente, i primi ogget- 
ti la cui ricerca richiese una teoria matematica. Un risultato di questa teoria fu 
la formazione di un elenco completo di 230 gruppi cristallografici. Questo elen- 
co si ottiene come risultato della soluzione dei seguenti problemi: 


a) Descrizione di tutti i gruppi finiti di rotazioni (inclusa la riflessione) del- 
lo spazio tridimensionale, vale a dire dei sottogruppi finiti di 0(3) a me- 
no di coniugio in 0(3). Questi gruppi sono numerosi: vi sono due serie in- 
finite, essenzialmente perché sul piano esistono poligoni regolari con un 
numero arbitrario di lati, e le rotazioni attorno a un asse passante per il 
loro centro possono essere d’ordine qualsiasi. 

b) La descrizione di quei gruppi del precedente elenco che trasformano in 
sé un reticolo di rango 3, vale a dire un sistema discreto di vettori isomorfo 
a Z3 come gruppo di traslazioni. Questi gruppi sono 32. Si può qui os- 
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servare che i gruppi di simmetria dei poliedri regolari non permettono di 
distinguerne alcuni: il cubo e l’ottaedro, come anche il dodecaedro e l’i- 
cosaedro, hanno le stesse simmetrie. La presenza di un reticolo invariante 
rende naturale anche una diversa relazione di equivalenza sull’insieme 
dei gruppi finiti di rotazioni: coniugio a meno di trasformazioni invertibili 
intere. Questa classificazione risulta più sottile e conduce a 73 classi d’e- 
quivalenza. 

c) Infine, le nominate 230 classi sono classi di gruppi contenenti sia le rota- 
zioni, sia le traslazioni; il gruppo delle traslazioni consiste precisamente 
negli spostamenti di vettori interi e la classificazione si effettua a meno di 
coniugio per mezzo di trasformazioni invertibili intere. 


La simmetria dei cristalli fu scoperta durante le ricerche macroscopiche del- 
le loro proprietà ottiche, meccaniche e chimiche. La struttura matematica dei 
gruppi cristallografici fu un argomento potente, ma non il principale, per ca- 
pire che queste proprietà riflettono la struttura di reticoli microscopici, nei nodi 
dei quali si trovano atomi di cristalli componenti la materia. Dopo l’elabora- 
zione dei metodi di ricerca roentgenografica questa comprensione ricevette una 
base sperimentale. 

Si passerà ora a una breve rassegna del ruolo che le concezioni di simmetria 
svolgono nelle rappresentazioni contemporanee della fisica. La fisica ha in mol- 
to rotto con le forme di «simmetria visibile» di cui si è detto finora. Le rap- 
presentazioni simmetriche si collegano alle idee di riproducibilità, indipenden- 
za dall’osservatore, leggi di conservazione, principî di media statistica e molti 
altri. 

Secondo l’osservazione del fisico americano Lee [1970] l’idea di simmetria 
si può collegare all'idea di «inosservabilità di alcune grandezze fondamentali ». 
Per chiarire questo pensiero, Lee porta il seguente esempio. 

Si consideri l’energia di interazione V di due particelle come funzione delle 
loro posizioni x, y. Il postulato fisico per cui la posizione assoluta non è osserva- 
bile conduce all’affermazione che V deve essere funzione soltanto della diffe- 
renza x—y, in modo che ogni spostamento spaziale xH+x+ a, y+y+@ non cam- 
bi questa differenza, e viceversa la differenza è l’unico invariante dello sposta- 
mento. Allo stesso tempo si ha la legge di conservazione del momento totale di 
quantità di moto, la cui velocità di variazione col tempo è —(V,+V,)V. 

Da un punto di vista rigorosamente logico tutta questa considerazione è 
vulnerabile. In effetti presuppone a priori la possibilità di costruire la «diffe- 
renza» x—-y, vale a dire postula l’esistenza e la struttura del gruppo di sposta- 
menti spaziali. Né l’una né l’altra segue in alcun modo dal postulato sull’inos- 
servabilità delle posizioni assolute a meno che questo postulato non venga pre- 
cisato per mezzo della scelta di una struttura matematica, in questo caso d’un 
modello galileiano di spazio-tempo. Dal punto di vista matematico, ad esempio, 
anche i punti di una sfera non hanno « posizioni assolute», ma la loro differenza 
sulla sfera non è definita e una funzione della coppia di punti, invariante ri- 
spetto alle rotazioni della sfera, deve essere descritta in tutt'altro modo. Pertanto 
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l’esempio di Lee va considerato come esplicazione dell'idea di «inosservabilità 
delle grandezze fondamentali», piuttosto che della simmetria. In effetti, all’in- 
terno dell’apparato matematico della fisica la rappresentazione dell’inosservabi- 
lità è espressa in maniera incomparabilmente meno definita dell’idea di simme- 
tria, che ha un formalismo sviluppato e numerose applicazioni effettive. D’al- 
tro lato, nelle discussioni semintuitive, filosofiche, assiologiche, la «inosservabi- 
lità» si presenta come una concezione molto preziosa. Nella tradizione filosofica 
europea l’idea di inosservabilità si può ricondurre al mito della caverna di Pla- 
tone. Negli esperimenti ideali di Galileo l’inosservabilità di un movimento iner- 
ziale assoluto (a differenza di uno relativo) viene utilizzata ormai completamente 
nello spirito moderno. Le concezioni positiviste, popolari nel xrx secolo, fecero 
dell’«inosservabilità» uno spauracchio; i tentativi di espellere dalle teorie le 
quantità inosservabili occuparono studiosi molto seri, e questi tentativi giunsero 
talvolta a importanti risultati. Tuttavia le rappresentazioni del posto preciso di 
ciò che è inosservabile nella struttura di una teoria scientifica furono spesso in- 
definite. Per questo l’idea di una connessione fra inosservabilità e simmetria, 
almeno in fisica, richiede una maggiore considerazione. 

Proseguendo la propria analisi dei principî della simmetria, Lee produce il 
seguente elenco, presente in pressoché tutti i manuali di teoria quantistica dei 
campi: 

1) simmetrie di traslazione, che conducono alle statistiche di Bose-Einstein 

e di Fermi-Dirac; 

2) trasformazioni continue dello spazio-tempo: traslazioni, rotazioni, acce- 

lerazioni, ecc.; 

3) trasformazioni discrete: inversione spaziale, inversione temporale; coniu- 

gazione di carica, che scambia di posto le particelle e le antiparticelle; 

4) trasformazioni unitarie, che comprendono: U,, la simmetria che conduce 

alle leggi di conservazione della carica, del numero barionico e dei numeri 
leptonici; SU (2), simmetria (isospin); SU (3), simmetria (di colore); ecc. 


Proseguendo questo elenco di concezioni, che ora si valutano più attiva- 
mente, si possono aggiungere: 


5) simmetrie di gauge; e anche 
6) supersimmetrie. 


Si torni alla considerazione delle simmetrie spazio-temporali. La prima co- 
sa che si può dire è che, dopo il sorgere della teoria generale della relatività, 
il contenuto stesso di queste simmetrie è divenuto dipendente dal modello. Il 
modello generale einsteiniano dello spazio-tempo, cioè la varietà quadridimen- 
sionale liscia con pseudometrica g,, dx dx” che soddisfa alle equazioni di Ein- 
stein con tensore di energia-impulso di aspetto qualsiasi, usualmente non ha 
alcuna simmetria. In altri termini, non esistono trasformazioni biunivoche non 
banali di questa varietà in sé, le quali conservino la pseudometrica. Si ricordi che 
in questi modelli non esiste né tempo assoluto, né spazio assoluto in un dato 
momento di tempo. 


sarta 
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Negli spazi generali di Einstein si sceglie tutto un repertorio di modelli co- 
smologici. La scelta di questi modelli è dettata, naturalmente, sia dai dati osser- 
vabili sia dall’accessibilità per la ricerca matematica. Entrambe le condizioni 
percorrono, in primo luogo, gli spazi nei quali si ha una qualche simmetria. 
Spesso la simmetria è introdotta in forma infinitesimale: come esistenza di cam- 
pi vettoriali che conservano la metrica (nel senso che la sua derivata di Lie 
lungo il campo tende a zero). T'ali campi vettoriali costituiscono un’algebra di 
Lie. Come sostituto del gruppo delle traslazioni spaziali R* (assolute o con- 
nesse con un sistema di riferimento inerziale nello spazio di Minkowski) si può 
usare allora un’algebra di Lie tridimensionale dei campi vettoriali simili del 
tipo descritto. Queste algebre di Lie furono classificate già da Bianchi, e ap- 
partengono a nove tipi, I-IX. Le usuali traslazioni corrispondono a un’algebra 
di Lie abeliana (tipo I), le rotazioni di una sfera 2-dimensionale costituiscono 
il tipo IX. Gli spazi di Einstein dei tipi corrispondenti furono sottoposti a studi 
accurati; in particolare, essi rivelano un'evoluzione ondulatoria molto interes- 
sante rispetto a movimenti indietro nel tempo fino al momento di singolarità, 
che modellizzano il big bang. 

Fra i dati dell’osservazione che motivano lo studio di modelli spazio-omo- 
genei dello spazio-tempo si possono osservare due fatti fondamentali: a) la 
quasi omogeneità e l’isotropia della diffusione della materia, se la si guarda con 
una scala abbastanza grande; bd) l’isotropia della radiazione residua a tempera- 
tura di circa 3 °K scoperta da Penzias e Wilson. 

Il modello di spazio-tempo, utilizzato al di fuori delle scale cosmologiche, 
ad esempio in fisica atomica, che rimane è essenzialmente lo spazio-tempo di 
Minkowski M (o perfino la sua versione precedente la relatività). Ciò si può 
spiegare matematicamente col fatto che nelle situazioni considerate la curvatura 
dello spazio-tempo è tanto piccola che il suo spazio tangente fornisce localmen- 
te un’approssimazione molto buona. Questo spazio tangente è proprio il mon- 
do di Minkowski. Da un punto di vista fisico, nella misura in cui la curvatura 
dello spazio-tempo si può interpretare come conseguenza dell’interazione gravi- 
tazionale, il fatto che sia piccola si spiega con la particolare debolezza dell’inte- 
razione gravitazionale in confronto con quelle forti e quelle elettromagnetiche 
che determinano essenzialmente le proprietà della materia per scale da labora- 
torio. Il ruolo dell'interazione gravitazionale su scala cosmologica diventa pre- 
valente grazie al fatto di essere universale, agente a distanza (a differenza di 
quella forte) e non avere «cariche di diverso segno», che potrebbero compen- 
sarsi (a differenza di quella elettromagnetica). 

Lo spazio-tempo di Minkowski possiede un gruppo fondamentale di sim- 
metria: il gruppo di Poincaré, che è generato dal gruppo quadridimensionale 
delle traslazioni R* e dal gruppo delle rotazioni che conservano la metrica di 
Minkowski, vale a dire il gruppo di Lorentz. Il gruppo completo di Lorentz ha 
quattro componenti connesse. Se nello spazio di Minkowski si fissa una base or- 
togonale con tre componenti spaziali e una componente temporale (e, €,, ©», 
ez), allora le trasformazioni di cambiamento di segno del tempo T° (x%» —x0, 
x44>x%, a= 1, 2, 3), di inversione spaziale P_(x%>x0, x°> —x%, a=1,2,3) e la 
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loro composizione PT appartengono a componenti diverse. La terza trasforma- 
zione dell’elenco di Lee, la coniugazione di carica C, s’interpreta meno diret- 
tamente in termini di spazio-tempo. Per introdurla occorre preliminarmente 
osservare che la componente connessa dell’unità L, del gruppo di Lorentz non 
è semplicemente connessa: il suo ricoprimento universale è il gruppo S1(2,C), 
il nucleo del ricoprimento consiste di (+1). L’isomorfismo di S1(2,C)/(4+1), cioè 
del gruppo delle trasformazioni razionali lineari della sfera di Riemann CP, 
con L, si esplica facilmente in maniera geometrica: anche L, agisce sulla sfera, 
precisamente sulla «sfera assoluta» dell’origine delle coordinate di Ly, vale a 
dire sull’insieme delle direzioni uscenti dall’origine delle coordinate. 

Quello spazio complesso bidimensionale su cui agisce il gruppo S1(2,C), ri- 
coprente Ly, si dice spazio (a due componenti) degli spinori Sy (nel punto ini- 
ziale). Accanto ad esso occorre considerare anche lo spazio complesso-coniu- 
gato S,; esso corrisponde a una seconda possibile orientazione della sfera asso- 
luta, e queste orientazioni si trasformano l’una nell’altra invertendo il tempo 7, 
scambiando i poli dell’assoluto passato e dell’assoluto futuro. Associando a 
ogni punto M il proprio spazio spinoriale, si ottiene su M un fibrato spino- 
riale quadridimensionale S®S sul quale si può definire in maniera naturale 
l’azione di S1(2,C), P e 7, compatibile con le azioni su M. L’operazione di 
coniugazione di carica C' porta in ogni punto di M lo spinore se S nello spinore 
se S, e se S in se S. Un'importante interpretazione fisica di C è possibile sol- 
tanto entro la descrizione quantistica della materia (a differenza della descri- 
zione non-quantistica dello spazio-tempo a cui ci si è limitati finora). Dirac 
introdusse il fibrato spinoriale per la necessità della descrizione quantistica re- 
lativistica di una particella carica con spin 1/2, ad esempio un elettrone. La 
funzione + di una simile particella, nella teoria di Dirac, è una sezione del fi- 
brato spinoriale S®@$. Lo sviluppo di Fourier di questa sezione permette di 
separare due componenti: a frequenza (o energia) positiva e negativa; la loro 
differenza è assoluta e i nomi, naturalmente, sono connessi a una scelta del- 
l’orientazione temporale dello spazio di Minkowski. Quando non era ancora 
formulata la concezione delle antiparticelle (dei «buchi» nella versione origi- 
naria), si riteneva che solo le sezioni a frequenza positiva avessero significato 
fisico. Proprio per questo la comparsa di componenti a frequenza negativa nel- 
le soluzioni dell'equazione di Dirac, che descrivevano l’elettrone nel campo 
elettromagnetico esterno (classico), era considerata un inspiegabile difetto del- 
la teoria. 

Dopo la scoperta del positrone (antiparticella dell’elettrone) risultò chiaro 
che l’operatore C' attesta una fondamentale simmetria fra particelle e antiparti- 
celle nella teoria semiclassica di Dirac, e le sezioni del fibrato spinoriale mo- 
dellizzano uno spazio di stati di un unico campo elettrone-positrone. L’indi- 
visibilità delle corrispondenti componenti di Fourier riceve una profonda spie- 
gazione in una teoria maggiormente conseguente, dove anche il campo elettro- 
magnetico è trattato come campo quantistico e il campo dei positroni si sotto- 
mette a quanti secondari, cosa che permette di tener conto dei processi in cui 
il numero delle particelle non si conserva. 
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Una conseguenza di questa teoria dell’elettrodinamica quantistica è la rap- 
presentazione del vuoto, nel quale si verifica una nascita spontanea e l’annichi- 
lazione delle coppie virtuali elettrone-positrone. In un campo abbastanza for- 
temente classico (cioè multifotonico quantistico), le particelle virtuali possono 
trasformarsi in reali. Uno «smussamento», una riflessione semiclassica di ciò 
è la superposizione delle due componenti del campo spinoriale nell’originaria 
trattazione di Dirac. 

Questa breve descrizione della storia della simmetria di C può servire da 
esempio della forza predittrice delle considerazioni sulla simmetria già a livello 
quantistico. Da un punto di vista puramente matematico si può considerare che 
con ciò sia giunta a compimento logico l’idea di Einstein relativa al fatto che il 
gruppo di Lorentz, compreso come gruppo delle simmetrie delle equazioni di 
Maxwell, sia il gruppo universale delle simmetrie per tutte le leggi della na- 
tura. La circostanza per cui l’interpretazione fisica di un ricoprimento sempli- 
cemente connesso del gruppo di Lorentz (o la sua «doppia rappresentazione», 
come dicono i fisici) S1(2,C) richiede già la teoria quantistica e, soprattutto, 
l’introduzione della prima osservabile realmente quantistica — lo spin e ancor 
di più la previsione dell’antimateria —, è un’illustrazione eccezionale della forza 
delle considerazioni della simmetria. 

La storia delle applicazioni C, P, 7, con ciò, è ben lungi dall’esser finita. 
In termini generali, sono le simmetrie dello spazio di stati di qualunque teoria 
quantistica del campo che opera con uno spazio-tempo piano e tiene conto delle 
interazioni elettromagnetiche e degli spin. Ma la dinamica può non conservare 
le simmetrie dello spazio delle fasi per diversi motivi: a) le leggi stesse del moto 
possono non essere invarianti rispetto alle simmetrie; d) può avvenire che le 
leggi del moto siano invarianti, ma che i fenomeni osservati non lo siano a 
causa di qualche condizione iniziale o al contorno (non controllate dalla teoria); 
c) lo stesso a causa di fenomeni d’instabilità (queste alterazioni della simmetria 
si è preso a chiamarle spontanee). 

L’alterazione dinamica della simmetria posseduta dallo spazio delle fasi è 
soggetta a una dimostrazione sperimentale. La scelta fra le alternative a), bd), 
c) (o una loro opportuna combinazione) per spiegare questa asimmetria è di- 
ventata un conseguente problema della teoria. 

Un esperimento mostra che in quei processi in cui le interazioni elettroma- 
gnetica e forte possono essere considerate indipendenti dalle altre, le simmetrie 
C e P non sono alterate. Ciò significa che per ogni processo del genere può es- 
sere realizzato un processo «specularmente simmetrico», nel quale le particelle 
sono sostituite con antiparticelle. La «realizzazione» consiste nel preparare le 
condizioni iniziali corrispondenti e nel misurare le probabilità degli stati finiti. 
Solo queste probabilità sono P- (oppure C-) invarianti. 

Nel 1957 si scopri che nei processi in cui intervengono interazioni deboli 
le simmetrie spaziali e di carica si alterano. Il K-mesone neutro a lunga vita 
K} è uno stato C- e P-invariante. I suoi due modi possibili di decomposizione 
Ki->etnov, e Ki->en*v, si trasformano l’uno nell’altro per mezzo dell’ope- 
ratore C. Il rapporto fra le loro probabilità è uguale a 1,003. Nella decompo- 
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sizione dei mesoni KX° si alterano anche la P-invarianza, la CP-invarianza com- 
binata e la T-invarianza. 

Le concezioni moderne all’interno delle quali si costruisce la teoria quanti- 
stica del campo che tiene conto dell’asimmetria delle interazioni deboli, si basa- 
no sull’idea di simmetria di gauge. La sua comparsa si può ancora far risalire al- 
l'esempio dell’originaria teoria di Dirac. Si ricordi che la costruzione degli spi- 
nori era connessa all’introduzione dello spazio delle rappresentazioni del grup- 
po S1(2,C), ricoprente il gruppo di Lorentz. È lo spazio dei gradi spinoriali di 
libertà. Nel formalismo della meccanica quantistica si assume che lo spazio de- 
gli stati di un sistema quantistico isolato sia lo spazio dei raggi complessi (sot- 
tospazi unidimensionali) di uno spazio complesso di Hilbert, vale a dire, in 
linguaggio matematico, lo spazio proiettivo associato. Se si rappresenta un rag- 
gio contenente il vettore di modulo 1, allora y si può sostituire con e°*), senza 
cambiare stato. « Il fattore non osservabile di fase » e'* non occorrerebbe conside- 
rarlo, se a ciò non obbligassero i principî di descrizione dell’unione dei sistemi 
quantistici: lo spazio degli stati di un’unione di sistemi è connesso al prodotto 
tensoriale degli spazi di stati originari — operazione che non si può formulare 
soltanto in termini di raggi, finché l’interazione dei sistemi (e anche la statistica 
quantistica) conduce a superposizione. A sua volta ciò rende osservabili effetti 
di «differenza di fase». 

La simmetria di gauge dell'equazione di Dirac si manifesta nel fatto che que- 
sta equazione è invariante rispetto a un simultaneo cambiamento del campo 
Y(x) col campo ei 4 (x) («fattori di fase indipendenti in punti diversi») e del 
potenziale elettromagnetico 4, con A,— d,î, d, = d/dxt (ciò non cambia le 
componenti del tensore F,,= dA, d,A,, che corrispondono a un’unica ca- 
ratteristica essenziale, locale, del campo). 

Tuttavia l’invarianza di gauge può essere interpretata più ampiamente: co- 
me principio che postula la necessità d’introdurre i campi A,, in grado di rea- 
lizzare cambiamenti negli spazi dei gradi interni di libertà da punto a punto 
dello spazio-tempo. Naturalmente il campo elettromagnetico non fu introdotto 
in questo modo. T'uttavia il campo portante l’interazione forte (i cui quanti si 
chiamano gluoni) fu introdotto proprio in questo modo. Inizialmente si os- 
servò che le forze che uniscono nel nucleo un neutrone e un protone sono quasi 
le stesse e si postulò che, dal punto di vista delle forze nucleari, con «esclu- 
sione» dell’interazione elettromagnetica, il neutrone e il protone si possono con- 
siderare come stati degeneri della stessa particella. Dalla loro superposizione 
è possibile costituire uno spazio d’isospin (in ogni punto dello spazio-tempo) 
bidimensionale. Il campo A, a valori nelle matrici (2x2), che può realizzare 
cambiamenti nello spazio dell’isospin, è introdotto in modo naturale come og- 
getto portante un’interazione. La sua lagrangiana si costruisce secondo il mo- 
dello della lagrangiana dell'equazione di Maxwell, con una differenza essenziale: 
poiché i potenziali matriciali di A4,, a differenza di quelli di Maxwell, non 
sono commutativi, per la conservazione dell’invarianza di gauge (rispetto alla 
sostituzione + ei)) occorre aggiungere dei termini non lineari all’equazione 
di moto, come fu rivelato da Yang e Mills. In termini tecnici, i campi di gauge 
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non abeliani posseggono un’autoazione che rende molto più complessa la loro 
teoria, e i fenomeni osservabili in tutto distinguibili da quelli elettromagnetici. 

A questa descrizione schematica dei campi di gauge occorre aggiungere al- 
cuni dettagli e precisazioni. Nei modelli moderni di interazioni forti, i neutroni 
e i protoni non si considerano come costituenti elementari, il loro ruolo è as- 
sunto dai quark. Corrispondentemente quei gradi interni di libertà nei cui spazi 
agiscono gruppi di simmetrie, non sono più d’isospin. Negli schemi più sem- 
plici e fondamentali svolgono il ruolo principale due gruppi: SU(3); e SU (3), 
Il primo mescola quark di tre tipi: è una simmetria approssimata, perché le mas- 
se di questi quark sono diverse. Il secondo mescola tre colori dei quark: questo 
gruppo si considera ora esatto, e il lagrangiano del campo dei gluoni è invariante 
rispetto ad esso. Si pone intensivamente lo studio del modo con cui le pro- 
prietà d’una teoria di gauge non abeliana permettono di chiarire l'assenza spe- 
rimentale dei quark in uno stato libero (confinamento del colore). L’introduzio- 
ne del gruppo SU(3); precedette, propriamente, la postulazione dei quark. 

Le idée di simmetria di gauge svolsero un ruolo decisivo anche nella for- 
mazione della prima teoria unitaria delle interazioni elettromagnetiche e deboli, 
la cosiddetta teoria di Salam-Weinberg. Nel loro modello il fotone e tre nuove 
particelle W*, Z°, portatori di interazioni deboli, sono i quanti di un campo 
di gauge. I bosoni intermedi di W*, Z° non sono ancora stati scoperti sperimen- 
talmente, ma le loro proprietà sono previste abbastanza precisamente ed espe- 
rimenti per la loro scoperta sono progettati per i prossimi anni. 

Si dirà infine qualche parola sulle statistiche di Fermi e di Bose-Einstein. 
Le particelle, le cui funzioni ) appartengono a una potenza tensoriale pari del 
fibrato spinoriale, vengono dette bosoni; a una dispari, fermioni. Nell'ultimo 
decennio si è cominciato a considerare le trasformazioni di supersimmetria, 
che mescolano fermioni e bosoni. Dal punto di vista matematico ciò conduce 
a considerare varietà sulle quali, oltre alle consuete funzioni, sono assegnate 
anche funzioni di coordinate « dispari», antisimmetriche e i gruppi con queste 
coordinate sono supergruppi di Lie. La supersimmetria di gauge si considera 
oggigiorno come principio fondamentale per la costruzione di una teoria unifi- 
cata di tutte le interazioni. 


2. Gruppie loro azioni. 


1. Esempi e illustrazioni. 


La maggior parte delle definizioni utilizzate più avanti è stata data negli ar- 
ticoli « Applicazioni», « Dualità », «Strutture matematiche», « Razionale/algebri- 
co/trascendente » in questa stessa Enciclopedia. Qui non le si ripeterà, ma sem- 
BE le si illustrerà. Sia XY un insieme di n elementi, ad esempio {1, 2, 

i. S, sia l’insieme dellé ‘applicazioni biunivochie di X in sé, o trasforma- 
zioni di x. S, è chiuso rispetto alla composizione, la quale è associativa; in 
S, è contenuta l’applicazione identica e accanto a ogni applicazione esiste l’in- 
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versa. In tal modo S, è un gruppo. Analogamente l’insieme degli isomorfismi 
in sé (automorfismi) di un oggetto arbitrario in una qualsiasi categoria è un 
gruppo (cfr. il citato articolo « Applicazioni »). Il numero d’elementi, o ordine 
di S,, è n! 

Il gruppo $,, è assegnato insieme alle proprie azioni: S,xX+X, (6,4) Pe(x). 
Ogni dasfornfiagione geS, genera un sottogruppo ciclico {1, 2,2, gt}, 
dove & è l’ordine di g. È comodo rappresentare un’azione g su {1, 2, ..., 2} sotto 
forma di collezione di cicli di tipo (125) (4) (36); una simile scrittura indica 
che g(1)=2, £(2)=5, £(5)=1, £(4)=4, £(3)=6 e £(6)=3. I sottoinsiemi di 

I, 2, ...,} compresi fra parentesi sono le orbite del sottogruppo generato da 
£: sottoinsiemi minimali di X che il sottogruppo trasforma in sé. L’intero grup- 
po $, agisce transitivamente su X, vale a dire X è costituito da un'orbita. Il sot- 
togruppo di $, che lascia fisso un punto xe X, cioè il sottogruppo stazionario 
di questo punto, è isomorfo a S,_1: il gruppo delle trasformazioni di X\ {x}. 
Se si cambia il punto x, allora il sottogruppo stazionario S(x) si trasforma nel 
sottogruppo coniugato S(y): S(y)=gS(x)g, dove ge S, è un elemento qual 
siasi per il quale 8(y)=x. Un sottogruppo per il quale coincidono tutti i suoi 
coniugati si dice normale. I sottogruppi normali del gruppo G sono esatta- 
mente i nuclei degli omomorfismi di G in un altro gruppo H: G+H. Un 
gruppo privo di sottogruppi normali non banali (diversi da {1} e da {G}) si 
dice semplice. Per n= 5 il gruppo S, ammette un unico sottogruppo normale 
non banale A4,, costituito dalle trasformazioni pari, le quali lasciano invariato 
il polinomio || (x;-x;) (qui X= {x,, xg, ..., x}). Il sottogruppo A, è già 
semplice. 1<si</sm 

Di nuovo, supponendo X= {x}, x9, ..., x,} è possibile definire l’azione di 
S, sullo spazio lineare dei -- omogenei F di grado d=>1 in x,, ..., %,, 2 
coefficienti complessi: 7,,F(x,, ..., xn) = F(g(x1), ....£71(x,)). Ogni operatore 
T, è un'applicazione lineare, e T, gn= TT, per ogni ghe S,. Una tale azione li- 
neare su uno spazio lineare si dice rappresentazione lineare del gruppo. 

Il gruppo G=Gl(L) di tutte Ie applicazioni lineari invertibili g:L>L, 
dove L è uno spazio lineare a dimensione finita su R oppure su C, è uno spazio 
topologico ed è anche una varietà differenziabile. Le applicazioni Gx G+G, 
GxL4+L che definiscono la legge di composizione e l’azione, sono morfismi 
delle corrispondenti categorie. In tal modo i gruppi lineari GI(L) sono il prin- 
cipale esempio di oggetti gruppo generali in una categoria e di loro azioni ca- 
tegoriali: i gruppi di Lie. 

Si consideri la categoria delle supervarietà differenziabili. I suoi oggetti 
sono coppie formate da una varietà differenziabile e da un fascio di anelli che è 
localmente isomorfo all’algebra esterna di un fibrato di dimensione finita. I 
morfismi sono gli abituali morfismi di spazi anellati. Gli oggetti gruppo in que- 
sta categoria si dicono supergruppi di Lie. 

Il gruppo di Lie G agisca sulla varietà X. Quest’azione può essere un mo- 
dello d’evoluzione temporale nello spazio delle fasi del sistema, o di azione di 
un gruppo di simmetria. I seguenti problemi relativi alla struttura dell’azione 
sono fondamentali: 
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a) La struttura dell'insieme delle orbite, la topologia delle loro mutue posi- 
zioni, le orbite di misura massimale e minimale, che attraggono o respin- 
gono gli insiemi. 

5) Il legame dell’azione con altre strutture, ad esempio una misura su X. 
L'esistenza di misure invarianti, la struttura degli insiemi instabili in- 
varianti. 

c) La decomposizione delle rappresentazioni di G in spazi funzionali su X 
di diverso tipo (analitici, lisci, misurabili, ecc.). 


Nello studio di questi problemi svolge un ruolo importante la teoria spet- 
trale degli operatori: la più importante caratteristica dell’azione di un operatore 
su uno spazio lineare. 


2.2. Spettro. 


Caso a dimensione finita. Sia L uno spazio lineare a dimensione finita sul 
campo dei numeri complessi C; A:L-+L sia un operatore lineare. Si dice 
spettro di A il sottoinsieme o(A) CC che ammette le seguenti descrizioni equi- 
valenti: 


N 


a)Xec(A) + l’operatore A—A-id non è invertibile (id:L-+L è l’opera- 
tore identico). 

b) Xec(A) «+ esiste un vettore non nullo 1e ZL tale che A(1)=%1. Se l’ul- 
tima condizione è verificata, il numero X si dice autovalore di A, il vet- 
tore 1 è un autovettore associato e lo spazio Ker(A—X-id) l’autospazio 
associato. 


Nel caso generale degli spazi lineari qualsiasi gli autovalori appartengono 
allo spettro, ma non lo esauriscono necessariamente. Il fatto che ogni elemento 
dello spettro sia un autovalore, nel caso a dimensione finita, deriva dall’esisten- 
za del determinante: det(A—X-id) come polinomio in X ammette tante radici 
complesse (tenendo conto delle molteplicità) quanta è la dimensione di L e 
per ogni radice A; il nucleo di A—;-id non è banale. 

Lo spettro di A è invariante rispetto al coniugio con un arbitrario operatore 
invertibile B: A+ BAB-. (Questo coniugio si può considerare come un au- 
tomorfismo del diagramma A:L+L). Nella classe degli operatori diagona- 
lizzabili, cioè degli operatori per cui L si decompone come somma diretta di 
autospazi, la coincidenza degli spettri implica il coniugio. 

Le seguenti importanti classi di operatori sono diagonalizzabili: 


1) Operatori con spettro semplice, cioè aventi tanti autovalori mutuamente 
disgiunti quanta è la dimensione di L. Poiché è possibile con una defor- 
mazione piccola quanto si voglia trasformare un arbitrario operatore in 
un operatore a spettro semplice, ne segue che gli operatori diagonalizza- 
bili costituiscono un aperto ovunque denso nello spazio di tutti gli ope- 
ratori. 
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2) Operatori che conservano il prodotto scalare non degenere, simmetrico 
o hermitiano. (Questi operatori si dicono rispettivamente ortogonali e 
unitari). Questi operatori costituiscono un gruppo di Lie (quando è fis- 
sato il corrispondente prodotto scalare). 

3) Operatori autoaggiunti, cioè operatori con la proprietà (A1,, 1,)=(1,, Al;), 
dove (1,, 1) è il prodotto scalare in L di uno dei due tipi considerati nel 
punto precedente. Questi operatori costituiscono un’algebra di Lie corri- 
spondente a un gruppo di Lie. 


La distribuzione dello spettro d’un operatore svolge un ruolo importante 
in numerosi problemi. Più diffuse sono le applicazioni a equazioni di evoluzione 
del tipo d1/dt= Al, dove 1 è un vettore di L dipendente dal tempo #. Nel caso 
dimL= 1, l’operatore A è semplicemente il prodotto per un numero comples- 
so A=a+bî e il comportamento qualitativo di ogni soluzione dell'equazione 
1(#)= e‘4+99*1(0) è definito dalla distribuzione di a+bi come segue: il segno cor- 
risponde all'evoluzione della grandezza 1: |I(#)] tende a zero per #-+co se 
a<o, e tende ad co per f-+c0 se a>o. La parte immaginaria è fornisce la fase, 
o la componente ondulatoria del processo. 

Il caso a<0 può corrispondere a processi quali la disintegrazione radioattiva, 
il caso 4>o a un'esplosione esponenziale, Poiché le equazioni di evoluzione li- 
neare sono spesso soltanto descrizioni approssimate di modelli non lineari più 
precisi in un intorno della posizione di equilibrio 1=0, il caso a<o corrisponde a 
un equilibrio stabile, 4>o non stabile. Il caso intermedio a=0, 970 descrive 
la possibilità di movimento ciclico in un intorno del punto di equilibrio. 

Se dimL>1 e l'operatore A è diagonalizzabile, l’evoluzione è il prodotto 
diretto di un numero finito di processi omogenei del tipo descritto. In partico- 
lare la distribuzione di c(4) nel semipiano ReX<o è un indice di stabilità del 
baricentro 1=0, e nel semipiano chiuso ReX<o di semistabilità. Il nuovo feno- 
meno che si presenta qui è la possibilità che l'operatore A cessi di essere diago- 
nalizzabile e assuma una radice multipla X. In questo caso, anche per ReX=o0, 
è possibile un movimento di ampiezza illimitata, crescente in modo polino- 
miale nel tempo, vale a dire il caso semistabile può divenire instabile quando le 
radici coincidono. 

Essenzialmente si è considerato l’operatore e4‘° connesso all’equazione di 
evoluzione. Un altro problema, la teoria delle catene di Markov, conduce a 
un’evoluzione con tempo discreto + 4%. In questo problema si considera un 
insieme costituito da d stati di un sistema che, in successivi momenti interi di 
tempo, può passare casualmente da uno stato a un altro. La probabilità di pas- 
saggio dallo stato ? allo stato j sia f;; (dipendente solo dalla coppia di stati). 
Si denoti con A la matrice i cui elementi sono p;;. Sia 1= (/;) la colonna che 
rappresenta la distribuzione di probabilità sull’insieme degli stati al momento 
n=0, Dopo il tempo x si ottiene la distribuzione di probabilità A”1. Gli ele- 
menti della matrice A sono non-negativi e la somma degli elementi di ciascuna 
colonna è uguale a 1; i corrispondenti operatori si dicono stocastici. Lo spettro 
di un operatore stocastico è costituito dalle radici dell’unità e anche da numeri 
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strettamente contenuti entro il cerchio unitario. Questi ultimi contribuiscono 
al comportamento di A" con termini tendenti a zero per n-+c0, mentre i pri- 
mi determinano il comportamento asintotico del sistema. 


Funzioni di operatori. In connessione coi modelli di evoluzione ci si è 
già imbattuti in funzioni di operatori del tipo e4‘ e 4%, Lo studio sistematico 
di queste funzioni di operatori negli spazi topologici permette di estendere la 
teoria dello spettro al caso infinito. Per i concetti utilizzati più avanti si veda 
l’articolo « Dualità » in questa stessa Enciclopedia, V, pp. 162 sgg. 

Sia 4 un operatore L-+L, dove L è uno spazio topologico, per definizione 
sul campo dei numeri complessi. Si tenterà di definire f(4) per una classe di 
funzioni f più ampia, estendendola per mezzo di alcuni procedimenti. 

a) Chiusura rispetto alle operazioni di anello. Se f(A) e g(A) sono già defi- 
nite, si può definire (af+£)(A4), dove ape C, e (fe)(A) per mezzo delle for- 
mule af(4)-+Bg(A) e f(A)-g(A) rispettivamente. In particolare, partendo dal- 
la funzione f(x)=x, si può definire p(A) per ogni polinomio in A. 

b) Divisione. Se f(A) e g(A) sono già definite e f(A) è invertibile, si può 
definire (f-1g)(4)=f(A)g(A). In particolare per R,(x)=(x—-) Pope- 
ratore R,(A) è definito se A—X-id è invertibile, cioè se X non appartiene al- 
lo spettro di A: proprio questa definizione di spettro viene assunta al posto di 
quella usuale. È facile mostrare che se f(x) è un polinomio le cui radici non ap- 
partengono allo spettro di A, allora f(4) è invertibile. 

c) Completamento topologico. È la prima operazione in cui si utilizza essen- 
zialmente il passaggio al limite. Si supponga di aver definito f(A) per la fun- 
zione f in qualche anello K. Si supponga che L sia uno spazio normato tale che 
A abbia norma ||A|<, e che K sia dotato di una norma rispetto alla quale 
l’applicazione f+f(A4) sia continua. Allora questa applicazione si può estendere 
al completamento X dell’anello K rispetto alla sua norma. Utilizzando questa 
astrazione si può, ad esempio, definire f(A) per ogni funzione continua, se 
n=dimL< co e A è diagonalizzabile, oppure per ogni funzione di A differen- 
ziabile x volte in senso ordinario. 

Sono possibili altri completamenti topologici; in seguito si riporteranno solo 
alcuni risultati. 


Operatori autoaggiunti limitati in uno spazio di Hilbert. Sia ora A un ope- 
ratore limitato nello spazio di Hilbert 7. Valgono i seguenti fatti: 

a) Lo spettro di A è un sottoinsieme compatto, non vuoto di C. Lo spettro 
dell’operatore aggiunto A* ha la forma 


c(A*)=c(A)= {A |Xe0(4)}. 


b) Sia f(x) una funzione razionale di x, priva di singolarità in o(A). Allora 
è definito l’operatore f(A) e il suo spettro ha la forma 


c(f(A))=f(c(A))={f()|Xe0(A)}. 


Simmetria 932 


c) Il numero sup{]2| |Aec(A)}=7(A) si dice raggio spettrale di A. Per 
ogni operatore limitato è uguale a lim |.A*]|Y" e per uno autoaggiunto a [| All. 


Lo spettro di un operatore autoaggiunto è reale e, in tal modo, è contenuto 
nell’intervallo [—||A], |A]. Se la funzione razionale f(x) non ha poli nello 
spettro, allora n 

Ù (AN = max }/0). 

Completando rispetto alla norma corrispondente, si ottiene la definizione 
di f(A) per ogni elemento f dell’anello €[—r, 7] delle funzioni continue nell’in- 
tervallo [—r, 7], dove r=||A||. 

d) Per ogni operatore autoaggiunto A esiste un unico omomorfismo conti- 
nuo dell’anello ©[-r, #] nell’algebra degli operatori limitati su H: fr+f(a), per 
cui valgono le seguenti proprietà: 1>id; x> 4; se f+B, allora f-+B*; infine 
l’omomorfismo non aumenta la norma. 

Si consideri ora un’altra estensione B[-r, r] dell’algebra ©[-r, 7]: essa 
consiste delle funzioni boreliane limitate nell’intervallo [-7, r]j. Gli elementi 
di quest’algebra si ottengono dalle funzioni continue con un passaggio al li- 
mite puntuale. a 

e) Sotto le condizioni del punto precedente, è possibile definire l estensione 
a B[-r,r] dell’omomorfismo descritto, con le seguenti proprietà: se (fn) è 
una successione di funzioni continue, limitate uniformemente, di C[-r, 7], e 
f(x)=limf,(x) per ogni xe [-r, 7], allora F{A)=limf,(A). e 
‘© Si darà un esempio che, come si vedrà più avanti, è tipico. Si consideri uno 
spazio di misura (X, p.) e sia H= L2(X,u) (si veda l’articolo « Dualità » in que- 
sta stessa Enciclopedia). Ogni funzione aeL..(X,u) definisce l'operatore A di 
prodotto per a in H. In questo caso f(A) è l'operatore di prodotto per f(a (x)). 


Operatori autoaggiunti non limitati. Se nell'esempio del paragrafo prece- 
dente si prende per a una funzione che non appartiene a L..(X,u), 1 operatore 
di prodotto per essa può risultare definito non su tutto L,(X,p). Ad esempio 
se X=R, p=misura di Lebesgue, a=x, allora xfeL,(X,p) non per ogni 

eL x ° .,°* . . 
d o) e questi operatori A, non ovunque definiti, ai loro grafici 
TcH®@HI; il grafico può essere un arbitrario sottospazio lineare algebrico 
non contenente elementi del tipo o®4, 470. La proiezione di I°, sul primo 
addendo H si dice dominio di definizione D, dell'operatore A, che definisce 
l'applicazione 4: D,-+H per mezzo della condizione x© Axe T,. 

Si definisce una involuzione #1 su 7@4 con la formula #(g®4)=-1©g 
e s’introduce l’operatore aggiunto ad A mediante la formula T',x= comple- 
mento ortogonale a #(1 ,). Il dominio di definizione di D a. può essere caratte- 
rizzato come il sottospazio {A | il funzionale g->(Ag,h) è limitato su D,}. L'u- 
suale uguaglianza (Ag, 1)= (g, A*4) è valida per ge Di, he Das. tan 

L’operatore B si dice un'estensione di A,BDA, se PgD5F,. La principale 
estensione di A è la chiusura, corrispondente alla chiusura del grafico T' 4. Tut- 
tavia essa non è sempre definita, poiché alla chiusura di I, possono apparte- 
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nere dei punti del tipo 0@4, 470. Un operatore con grafico chiuso si dice 
chiuso. A* è sempre chiuso e (A*)*, quando è definito, coincide con la chiu- 
sura di A. 

Per gli operatori considerati, non necessariamente limitati, s'introduce una 
generalizzazione della condizione di autoaggiunzione in alcune varianti non 
equivalenti. 


Un operatore per cui (Ax, y)= (x, 4y) per x,y D ovvero ACA*, si di- 
ce simmetrico. 

Un operatore per cui D= Da e A= A* nel comune dominio di definizio- 
ne si dice autoaggiunto. Infine un operatore la cui chiusura è autoaggiunta si 
dice essenzialmente autoaggiunto. 

Ad esempio sia A l’operatore di prodotto per x in L3(R, dx) con dominio di 
definizione D, = D(R) (funzioni a supporto compatto indefinitamente differen- 
ziabili su R). Allora A* è l'operatore di prodotto per x con dominio di definizio- 
ne Dya= {fe Ls(R,dx)|xfe L,(R,dx)}. Cosi A* è autoaggiunto, A è simme- 
trico ed essenzialmente autoaggiunto. 

In maniera analoga, sia A=d/dx, D,=9D(R), L=L,(R,dx). Allora A*= 
=—d/dx e D4» consiste di quelle funzioni la cui derivata generalizzata appar- 
tiene a L,(R, dx). 

Gli operatori spesso sono dati con espressioni differenziali; in questo caso 
non è difficile verificare la simmetria dell'operatore. Se A è simmetrico, allora 
essere essenzialmente autoaggiunto equivale al fatto che Ker(A*+i-id)= {0} e 
anche al fatto che l’immagine di A*+1-id è densa in 77. Ad esempio l'operatore 
i(d/dx) in L,(R,dx) è simmetrico. L'equazione (A*+i-id)f=o ha soluzioni 
f=c-e*® che non appartengono a L,(R,dx) di modo che Ker(A*+i-id)= {o}. 
Di conseguenza A è essenzialmente autoaggiunto. 


Teorema spettrale. Eccone la variante più semplice. Siano A,, 4y, ..., 4, 
degli operatori autoaggiunti, limitati, a due a due permutabili nello spazio di 
Hilbert H. Si può allora costruire un isomorfismo di H. con La(X,p) e delle 
funzioni 4,(x)e L..(X,u) di modo che A; diventi il prodotto per d;. 

Utilizzando questo teorema si può definire una funzione a partire da ope- 
ratori autoaggiunti; non necessariamente limitati. Più precisamente per un 
tale operatore A esiste un unico omomorfismo dell’algebra B(R) delle fun- 
zioni boreliane limitate su R nell’algebra End 7, che porta 1 in id e gode delle 
seguenti proprietà: 


a) o[(t+i)/(t-i)]=(A+:-id)(A—i.id)!=B. 


5) Se |fn()<C e f,(1)+f(1) per ogni teR, allora @(f,) converge forte- 
mente a f. 


La dimostrazione consiste nella costruzione di B come prodotto per una 
funzione misurabile e in un opportuno passaggio al limite. 

Il metodo più comodo per formulare il teorema spettrale generale consiste 
nell’introdurre un sistema di concetti connessi alla misura spettrale. 

Sia (X, B) uno spazio con una c-algebra di sottoinsiemi, contenente X, 
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e sia H uno spazio di Hilbert. Si chiama misura spettrale una funzione 
X:B-EndH che verifica le condizioni: 


a)i valori di ) sono proiettori ortogonali; 

5) X(E,NE,)=ME)}(E2); MEUE,)= ME) +A(£,), se E, E,6B sono 
disgiunti; 

c) se esiste il limite E=limE,, allora X(£)= s-limA(£,) 


Esempio caratteristico: sia yu una misura c-additiva su B, H=L,(X,u), 
\(E)=operatore di prodotto per la funzione caratteristica di E. 

Grazie al metodo di Lebesgue, è possibile definire l'integrale associato a 
una misura spettrale; i suoi valori sono operatori. 

Il teorema generale sulla decomposizione spettrale di un operatore auto- 
aggiunto 4, non necessariamente limitato, può ora essere formulato come se- 
gue. Esiste un’unica misura spettrale sui sottoinsiemi di Borel B, per cui 
A= [t® xdX(x). Inoltre, per ogni funzione boreliana limitata f su R, f(4)= 
= [E/(0) dA (2). 

Se f è misurabile, ma non limitata, si può definire dute integrale come 
operatore con dominio di definizione D;,,) ={{eH|{f(x)}}dX(x)< co}, dove 
Ve (E)= (AE 3 mas. i 

i Lasi SARETE degli operatori autoaggiunti di dimensione fi- 
nita come generatori infinitesimali del gruppo unitario è il teorema di Stone. 

Sia {V(t)}, te R, una famiglia di operatori unitari in H, continua rispetto 
alla topologia debole degli operatori e tale che V(s+t)=V(s)V(#) per ogni 
s,te R. Una tale famiglia si chiama gruppo a un parametro. Il teorema di Stone 
afferma che ogni gruppo a un parametro è del tipo {e!4} dove A è un opera- 
tore autoaggiunto. Questo teorema giustifica il fatto che, nei modelli della mec- 
canica quantistica, l'evoluzione temporale — un gruppo a un parametro di ope- 
ratori unitari nello spazio di Hilbert degli stati — sia spesso data dall’operatore 
di Hamilton (A nel precedente capoverso). 


2.3. Rappresentazioni lineari. 


Definizioni generali. Siano G un gruppo, H uno spazio lineare e G1(4) 
il gruppo dei suoi endomorfismi lineari invertibili. Si dice rappresentazione 
T del gruppo G nello spazio 7 un omomorfismo di gruppi T: G-GI(H). 
Siano 7, e 7, due rappresentazioni del gruppo G negli spazi H, € H, rispetti 
vamente. Si dice operatore di intreccio o morfismo f:T- T, un applicazione 
lineare f:H,->H, tale che, per ogni ge Gi valga la condizione foT.(g)= 
=T,(g)of. La rappresentazione 7° è (algebricamente) irriducibile se nel suo 
spazio non vi sono sottospazi propri invarianti rispetto a tutti gli DET 
T(g), ge G. Le rappresentazioni del gruppo G, come oggetti, e gli operatori di 
intreccio come morfismi, costituiscono la categoria delle rappresentazioni di G. 
Gli isomorfismi di questa categoria si dicono usualmente equivalenze fra le rap- 
presentazioni corrispondenti. In essa si hanno anche somme dirette e prodot- 
ti tensoriali. 
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Se il gruppo G ha una struttura ulteriore, ad esempio di spazio topologico 
o di varietà liscia, è naturale considerare quegli spazi H tali che Gl(4), o una 
sua parte, sia dotato di analoga struttura, e limitarsi alle rappresentazioni 
G-G1(47) che conservano questa struttura e ai corrispondenti operatori d’in- 
treccio. 

Una situazione abbastanza consueta si ottiene quando 7 è uno spazio di 
Hilbert o di Banach, G1(7) è il gruppo degli operatori limitati, G è un gruppo 
topologico. Le condizioni sulla continuità di 7° possono essere di tipo diverso, 
poiché in un gruppo di operatori si possono introdurre più topologie. 


Rappresentazioni di dimensione finita d'un gruppo ciclico. Sia G= {g" |neZ}, 
dove g è un generatore del gruppo G. Ogni rappresentazione 7° del gruppo G 
nello spazio H è univocamente determinata dall’operatore A = T(g)e H. Se G 
ha ordine infinito, A può essere qualsiasi; se G ha ordine finito d, allora A deve 
soddisfare la condizione A“=id. Due rappresentazioni nello stesso spazio H, 
corrispondenti agli operatori A, e A,, sono equivalenti se e solo se gli operatori 
sono coniugati, cioè se A,= BA4,B-! per qualche Be GI(H). Pertanto la classi- 
ficazione delle rappresentazioni di un gruppo ciclico infinito coincide con la 
classificazione degli operatori, a meno di coniugio. Si è già visto che il princi- 
pale invariante di un operatore, in questa classificazione, è il suo spettro. S’in- 
troducono pertanto alcuni concetti di teoria delle rappresentazioni che a questo 
sono connessi. Sia 7 uno spazio a dimensione finita sul campo €. 

a) Operatori diagonalizzabili. Se A è diagonalizzabile, in H esiste una base 
di autovettori di A. Ciò significa che la rappresentazione T': G+G1(H) si de- 
compone nella somma diretta di sottospazi unidimensionali. Soltanto la de- 


composizione in somma H= ®@ 4, dove H,={heH|A(1h)=M}, dimH, = 
Xe0(A) 


= molteplicità di X come radice di det(A—x-id)=o, ha significato invariante. 
Per ogni sottorappresentazione 7°, cioè per un sottospazio H7, C 77 con la pro- 
prietà A(H,)CH,, esiste una sottorappresentazione Ty (cioè un sottospazio 
A-invariante Ho CH) tale che T=T,© 7, (cioè H=H,@©H, e l’azione T(g) 
è somma diretta delle azioni). Questa proprietà molto importante si dice ridu- 
cibilità completa della rappresentazione 7. 


5) Operatori non diagonalizzabili. Un esempio di tale operatore è dato da 


ZI ; O I 
(03) i4+(3) 
o più in generale da un blocco di Jordan 


OIO.. 


B,(2)=)-id+ Cor... i 


0... (o) 


di dimensione mx, r>2. Sebbene B,,(2) abbia un solo autovalore ), tutto lo 
spazio H su cui agisce B,(X) non è un autospazio per B,, per 1=2. In effetti 
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dim Ker(B,(A)—A-id)=1 e il corrispondente autospazio non ha un comple- 
tamento invariante. In tal modo una rappresentazione di un gruppo ciclico con 
T(g)=B,(A) non è completamente riducibile. 

Si può dimostrare che ogni rappresentazione di dimensione finita di un 
gruppo ciclico su un campo algebricamente chiuso è equivalente a una somma 
diretta di rappresentazioni corrispondenti ad alcuni blocchi B,,(A;), dove {X;} 
è lo spettro dell'operatore del generatore 7(g). 

Su un campo non chiuso la classificazione si complica per il fatto che i punti 
dello spettro possono non appartenere al campo. La classificazione delle rap- 
presentazioni di gruppo su un campo non chiuso richiede in maniera essen- 
ziale che si tenga conto dell’azione del gruppo di Galois della chiusura del cam- 
po delle costanti su cui è definito lo spazio della rappresentazione. Questa osser- 
vazione è generale e banale. A un livello superiore non è banale il fatto che la 
classificazione di determinate rappresentazioni di gruppi, quali il gruppo delle 
matrici su campi «aritmetici) (numeri razionali, numeri p-adici, ecc.), è un 
problema duale a quello della classificazione delle rappresentazioni del gruppo 
di Galois corrispondente. 

Nel seguito, salvo avviso contrario, si avrà a che fare soprattutto con rap- 
presentazioni su C. 

c) Meccanismi di semisemplicità. Si supponga di voler dimostrare la semi- 
semplicità di una data rappresentazione 7 del gruppo G (non necessariamente 
ciclico). Ecco una tecnica standard: 7 è semisemplice se conserva un prodotto 
scalare non degenere simmetrico (o hermitiano) nello spazio delle rappresen- 
tazioni di H, vale a dire se (T(g)A,, T(g)h2)= (4,49) per ogni ge G, hje H. 
In effetti in questo caso è invariante il completamento ortogonale rispetto a un 
qualunque sottospazio invariante. 

L'esistenza di un tale prodotto scalare viene spesso assunta. Rispetto ad es- 
so tutti gli operatori 7'(g) saranno ortogonali oppure unitari; da ciò prendono 
nome le rappresentazioni. 

A volte se ne può dimostrare l’esistenza. Ecco un metodo universale di me- 
dia: se il gruppo G è finito, allora, qualunque sia il prodotto scalare f(4,,/s) 
in H, se ne può costruire uno invariante ponendo 


(hh) == Y f(T(@)ly, T(O)ho). 
[Gi ge& 


Naturalmente il caso non degenere va trattato in maniera separata. 

In tal modo è possibile dimostrare il classico teorema di Maschke: ogni rap- 
presentazione di un gruppo finito G su € (0 su un qualunque campo di carat- 
teristica che non divide l’ordine di G) è completamente riducibile. 

Nella categoria dei gruppi topologici compatti la media può essere sosti- 
tuita con l’integrale invariante di Haar. Grazie a ciò è possibile stabilire che 
ogni rappresentazione fortemente continua di un gruppo compatto G nello spa- 
zio di Hilbert H ammette un prodotto scalare invariante, la cui norma defini- 
sce in H la stessa topologia di partenza. Di conseguenza si dimostra che ogni 
tale rappresentazione si decompone in somma diretta (hilbertiana) di addendi 
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irriducibili a dimensione finita. (La dimensione finita delle rappresentazioni 
irriducibili di un gruppo finito segue direttamente dal fatto che ogni vettore 


he H è contenuto nel sottospazio invariante )° T(g)A; questa osservazione pre- 
ge@ 


suppone che si possa utilizzare l’integrazione-media nella dimostrazione ed an- 
che in generale, ma naturalmente ciò non è affatto banale). 

d) Caratteri. Come si è già visto, una rappresentazione di un gruppo ciclico 
è semisemplice se e solo se gli operatori sono diagonalizzabili. Inoltre per ritro- 
vare la rappresentazione, a meno di equivalenze, in questo caso è sufficiente co- 
noscere gli spettri degli operatori T(g) (o anche di uno solo di essi che sia ge- 
neratore). 

Ma lo spettro di un operatore lineare a dimensione finita è univocamente de- 
terminato quando sono note le tracce di tutti i suoi ordini: in effetti allora, me- 
diante la formula di Newton, si possono ritrovare le funzioni simmetriche ele- 
mentari degli elementi dello spettro e in seguito questi stessi elementi come 
radici del polinomio caratteristico. In tal modo si ottiene il seguente risultato. 

Si dice carattere y d’una rappresentazione di dimensione finita 7 del gruppo 
G la funzione y:G+C: y(g)= Tr(T(g)). Se G è ciclico e T è completamente 
riducibile, allora 7 è univocamente determinata dal suo carattere, a meno di 
equivalenza. 

Entrambi questi risultati sono veri per le rappresentazioni di tutti i gruppi 
finiti, e anche per le rappresentazioni unitarie dei gruppi compatti. Valgono 
sia la riducibilità completa di tutte queste rappresentazioni che la possibilità 
di ritrovare ogni rappresentazione a partire dal suo carattere. 


2.4. Alcuni risultati classificatori della teoria delle rappresentazioni. 


Generalità. Sia G un gruppo topologico compatto, G lo spazio delle sue 
rappresentazioni unitarie irriducibili (si veda l’articolo «Dualità» in questa 
stessa Enciclopedia). Per ogni classe di rappresentazioni (unitarie, complesse) 
isomorfe re G sia scelto un suo rappresentante n: G+U(H.) (gruppo degli 
operatori unitari nello spazio di Hilbert H7; x è continua rispetto alla topologia 
debole). Lo spazio H_ ha dimensione finita. 

La misura invariante di Haar su G permette d’introdurre lo spazio L*(G) 
delle funzioni a quadrato integrabile. È lo spazio di due rappresentazioni di G: 
grazie alle traslazioni sinistre e destre, queste rappresentazioni si dicono rego- 
lari. Il teorema fondamentale di Peter-Weyl afferma che si ha una equivalenza 


di rappresentazioni L°(G)= © H_©H*, inoltre l’azione delle traslazioni sini- 
nel 


stre (destre) sulle funzioni corrisponde all’azione di G su H, (su H#). 

In particolare, se G è un gruppo finito, L*(G) può essere identificato con l’a- 
nello di gruppo C[G]. Ogni rappresentazione irriducibile di G è equivalente a 
una rappresentazione unitaria, e pertanto è contenuta in una regolare (di mol- 
teplicità uguale alla sua dimensione, o ordine). 

Sorgono i seguenti problemi: come descrivere l'insieme G? Come descri- 
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vere le realizzazioni concrete di H,_? Come descrivere la categoria delle rappre- 
sentazioni (col suo prodotto tensoriale strutturale e le somme dirette) di cui 
{H,} sono i generatori? Quali sono le proprietà funtoriali di questa categoria al 
variare di G, ad esempio per restrizione al sottogruppo 7CG o per induzione 
dal sottogruppo (questi due funtori sono aggiunti; si veda il già citato articolo 
«Dualità »). 

Le risposte a questi problemi sono connesse fra loro e non sono univoche; 
in particolare risultano utili alcune realizzazioni concrete e lo studio delle con- 
nessioni fra queste. Seguono qui alcune informazioni sulle rappresentazioni 
dei gruppi finiti G. 

Prima di tutto, in L*?(G)=Map(G,C) si introduce il prodotto scalare 
(p,4)= Lo] Ogni carattere della rappresentazione di dimensione 


finita 7 è una funzione centrale su G, vale a dire y(gAg-1)=y(4) per ogni 
g,heG. Si denoti con H il sottospazio di tutte le funzioni iii in L*(G). 
Allora i caratteri {y,|r€ G} costituiscono una base ortonormale dello spazio 
H. Da qui segue, in particolare, che l’ordine di G è uguale al numero di classi di 
elementi coniugati nel gruppo G (4, e 4y sono coniugati se Ay=gA,g°! per un g 
opportuno). Se G è abeliano, allora G=G*= Hom(G,C*)= Mr|me G} (si 
veda «Dualità»). Inoltre è noto che l’ordine delle rappresentazioni irriducibili 
del gruppo G divide l'ordine di G (e anche l’ordine dei gruppi quoziente di G 
rispetto a un divisore abeliano normale). Insieme a un corollario del teorema 
sulla rappresentazione regolare: Y y_(id)?=|G|?, questi risultati spesso per- 
TE 

mettono di stabilire se una famiglia di rappresentazioni irriducibili del gruppo, 
costruita in qualche modo, è completa. 

Sia FCG un sottogruppo. La restrizione Res$, o Res, di ogni rappresen- 
tazione del gruppo G al sottogruppo F definisce un funtore dalla categoria 
delle rappresentazioni di G alla categoria delle rappresentazioni di F. Questo 
funtore è compatibile con le somme dirette e i prodotti tensoriali. Ammette 
come funtore aggiunto l’induzione Ind & o Ind. La forma concreta di Ind su- 
gli oggetti è la seguente: se F è sabprescatabile nello spazio H, allora Ind f(H7)= 
=C[G] ® H con azione attraverso il fattore sinistro. L’aggiunzione dei fun- 

CIFI 
tori si riflette in coniugio dei caratteri delle rappresentazioni rispetto al pro- 
dotto scalare standard in L*(G) e L*(H). Precisamente, siano y € @ i caratteri 
di due rappresentazioni dei gruppi G e F rispettivamente. Allora (y, Ind@)g= 
= (Resx,®)g (formula di reciprocità di Frobenius). In particolare se y e @ 
sono caratteri di rappresentazioni irriducibili, allora le molteplicità d’inclusione 
di y in Ind e di g in Resy coincidono. 

L’induzione viene spesso usata nella costruzione dei caratteri e delle rappre- 
sentazioni di un gruppo più ampio, partendo dall’insieme delle rappresentazio- 
ni di un gruppo più piccolo, in particolare abeliano. Ad esempio, in accordo 
col teorema di Artin, i caratteri indotti dalle rappresentazioni di tutti i possi- 
bili sottogruppi ciclici di un gruppo finito generano lo spazio delle funzioni 


cretina! 


939 Simmetria 


centrali su Q. La restrizione a un gruppo più piccolo, spesso ancora abelia- 
no, fornisce un utile metodo di classificazione delle rappresentazioni. 

Più avanti si descriverà brevemente come queste idee agiscono nel caso dei 
gruppi connessi e compatti, in particolare dei gruppi di Lie. Prima comunque si 
considererà il caso dei gruppi localmente compatti, ma non compatti, che sod- 
disfino una condizione tecnica importante: sono di classe 1. Questa condizione 
è soddisfatta, in particolare, da tutti i gruppi classici di matrici, come SI(x,R), 
S1(2,C), SO(p,9), ecc. In questo caso il ruolo del teorema di Peter- -Weyl viene 
assunto dalla formula astratta di Plancherel: su G esiste una misura du(7t) 
tale che L?(G) si decomponga come integrale diretto di spazi di Hilbert, in ge- 
nerale di dimensione infinita, | E-@Hidu(r). Nel caso più semplice G = R, 


si ha G=Re questa formula riassume l’essenza della classica analisi di Fourier 
sulla retta: ai caratteri y,, ae R, y,(x)= eÎ corrispondono spazi unidimensio- 
nali che appartengono a L?(R) solo «infinitesimalmente ». Fin dal suo inizio la 
teoria dei caratteri richiede l’introduzione di funzioni generalizzate, poiché tali 
sono le tracce degli operatori unitari a dimensione infinita. 


2.5. Classificazione dei gruppi compatti di Lie. 


In accordo con il teorema di Hurwitz, R (numeri reali), C (numeri comples- 
si) e H (quaternioni) esauriscono i campi topologici su R. In ognuno di essi 
si ha un’operazione di coniugio (l’identità in R) che permette d’introdurre 
il concetto di forma quadratica (hermitiana, hermitiana per quaternioni) defi- 
nita positiva sugli spazi a dimensione finita K”, (Rispetto a una base opportuna, 
questa forma è del tipo Y)'x,&;). Il gruppo delle trasformazioni K-lineari di K* 
che hanno determinante unitario e che conservano questa forma si denota ri- 
spettivamente SO(x), SU(2), Sp(x). Questi gruppi di tre tipi di rotazioni or- 
togonali, detti gruppi classici di Lie, costituiscono la fondamentale dotazione 
dei gruppi compatti di Lie e tutti i rimanenti sono loro «parenti prossimi). 
Precisamente: a) con esclusione di alcuni fra i primi valori di x, questi gruppi 
sono semplici, a due a due non isomorfi, e hanno gruppi fondamentali finiti; 
b) tutti i gruppi di Lie semplici e compatti sono esauriti dalle loro coperture 
finite, ed anche da una collezione finita di gruppi particolari; questi ultimi han- 
no realizzazioni canoniche sotto forma di sottogruppi chiusi dei gruppi classici. 

Una dettagliata teoria classificatoria, di cui si parlerà più avanti, completa 
questo semplice quadro in due aspetti essenziali: in primo luogo è data una ca- 
ratterizzazione assiomatica di quella naturale classe di gruppi a cui appartengono 
le serie classiche, e si mettono in luce alcuni elementi particolari di questa clas- 
se, che da un punto di vista intuitivo non sono affatto evidenti; in secondo luogo 
si elabora una tecnica per lo studio strutturale di questi gruppi e delle loro rap- 
presentazioni, la quale ha un particolare valore in tutte le applicazioni: la tec- 
nica delle radici e delle decomposizioni radicali. 
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Toro. Il più semplice gruppo compatto e connesso di Lie è la circonferen- 
za {zeC||z|=1}. Il prodotto diretto di x circonferenze si dice toro x-dimensio- 
nale. Ogni gruppo di Lie abeliano, compatto e connesso, è un toro. La teoria 
strutturale dei gruppi di Lie semplici e compatti si basa essenzialmente sullo 
studio dei tori massimali in essi contenuti. Il motivo di questo fatto si può ritro- 
vare osservando che il gruppo SO(2) delle rotazioni del piano euclideo è esso 
stesso un toro unidimensionale, e che alle decomposizioni di R?" in somma di- 
retta di piani ortogonali corrisponde un toro n-dimensionale in SO(2r), relati- 
vo alle rotazioni indipendenti di questi piani. In tal modo, anche non sapendo 
a priori che un dato gruppo è il gruppo delle rotazioni ortogonali da qualche 
parte, i tori permettono di catturare le « più semplici rotazioni». 


Algebra di Lie. Ogni gruppo di Lie porta con sé anche lo spazio lineare 
sul quale si rappresenta: si tratta dello spazio tangente nell’unità di L(G), e 
la rappresentazione Ad: G+ Aut L(G), detta aggiunta, è tangente nell'unità al- 
l'applicazione di coniugio x-++gxg71, x,ge G. Lo spazio L(G) è anche un’alge- 
bra di Lie: se con ad si denota l’applicazione tangente a Ad, l'operazione 
[x,y]=adx(y) è una parentesi di Lie. 


Rappresentazione del toro su un’algebra di Lie. Sia TCG un toro. La rap- 
presentazione Ad del toro T° su L(G) si decompone nella somma diretta 


Mm 

L®YL dove la rappresentazione di 7 su Lo è banale e ogni L, è un piano 
sl 

euclideo su cui l’azione di te T è la rotazione di angolo 2r:8;(t). La struttura 


euclidea invariante su ogni L; è univocamente determinata, a meno di un fatto- 
re scalare, di modo che i 9;(#) sono definiti modZ, ed anche a meno di cam- 
biamenti di segno, corrispondenti a cambiamenti di orientazione su L,. 


Radici. Ogni toro di G è contenuto in un toro massimale; ogni sotto- 
gruppo abeliano connesso, contenente un toro massimale, coincide con esso. 
Se T è massimale, allora il sottospazio L,CZ(G) definito sopra, su cui L(7) 
agisce in modo banale, coincide con L(T) (nel caso generale L.CL(7)). Sia 
inoltre 7° massimale. 

L'applicazione exp:L(T)>7 è un omomorfismo di gruppi topologici 
R'-+ T, dover = dim 7; il suo nucleo è un reticolo, cioè un sottogruppo discreto 
di rango r in L(7). Le funzioni 8: T-+R/Z si possono estendere univocamen- 
te a funzioni, ancora denotate con 9,: L(7)+R. Si tratta di forme lineari che 
assumono valori interi sul reticolo di L(7°) che è il nucleo di exp. 

La famiglia delle forme {+®;} si dice sistema di radici 2(G) del gruppo 
G. Esso non dipende in maniera essenziale dalla scelta del toro massimale: tutti 
questi sono a due a due coniugati, e il coniugio porta un sistema di radici nel- 
l’altro. Ad esempio nel gruppo U (x) il toro massimale T è l'insieme delle ma- 
trici diagonali diag(exp(27x,), ..., exp(27x,)), e le radici sono le differenze 
x, Hg, YRES. 


Hora 


PR int 
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Sistemi astratti di radici. Il sistema delle radici di un gruppo compatto di 
Lie G è un insieme finito di vettori nello spazio euclideo L(7°)* (con metrica 
invariante rispetto alle rappresentazioni aggiunte). Questo insieme finito pos- 
siede notevoli proprietà di simmetria, che è comodo assiomatizzare introducen- 
do la seguente definizione di sistema astratto di radici X nello spazio euclideo E: 


a) 2CE è un sottoinsieme finito non contenente lo zero e tale che, se xe X 
e caeX, allora c= +1. 

5) Sia aeX e P,={yeE]|(y,a)=0)} sia l’ipersuperficie ortogonale ad «. 
Allora la riflessione rispetto ad essa porta X in sé. 


c) Si ponga {a, B}= 2(«, 8)/(6, B). Allora {a,B}eZ per ogni a, pe Z. 


Ogni sistema di radici di un gruppo compatto di Lie soddisfa queste con- 
dizioni. Inoltre nello spazio E=Z(T)* a cui appartengono le radici si isola un 
reticolo di pesi A(G) delle funzioni che assumono valori interi nel nucleo di 
exp in L(7). Tale reticolo è connesso con il sistema di radici come segue: 


A0= Va ZCA(G) 


A;= fe E|{,x}eZ per ogni ae Z} 2 A(G). 


La teoria della classificazione dei gruppi compatti di Lie si sviluppa ulterior- 
mente in due parti: dapprima si dimostra che un gruppo è definito dal suo siste- 
ma di radici e dal reticolo dei pesi; in secondo luogo queste coppie vengono 
classificate. 


Gruppi e sistemi di radici. Sia & E un arbitrario sistema di radici. A. par- 
tire da Y. si costruiscano due reticoli AjCA, come prima e si scelga un qualun- 
que reticolo intermedio di rango massimale AgCACA;. Allora esistono un 
gruppo di Lie G, connesso e compatto, un toro massimale in esso TCG e un 
isomorfismo gp: E+L(T)* che porta X in X(G) e A_ in A(G). 

La costruzione di (G, 7) è funtoriale rispetto agli isomorfismi di terne 
(E, 2, A): gli isomorfismi sono indotti dalle applicazioni lineari di £ che por- 
tano X in Z' e conservano l’operazione {, 8} (non il prodotto scalare, che non è 
univocamente definito in L(7)). 


Classificazione dei sistemi di radici. Se (E,, 2) e (E,, 23) sono due sistemi 
di radici, allora anche (£,® 4, Z,UX) è un sistema di radici. Î sistemi che 
non si possono rappresentare in questa forma sono detti irriducibili. Ogni siste- 
ma di radici si decompone univocamente come somma diretta di componenti 
irriducibili. 

I sistemi irriducibili si possono classificare come segue. Ogni ipersuperficie 
di E divide X in due parti 2, e X_ in modo corrispondente alla decomposizione 
in componenti del complemento dell’ipersuperficie. Si dicono radici positive 
gli elementi di X,. Si distingue in X, il sottoinsieme delle radici semplici Il, 
cioè tali che a#B+y per ogni f,yeX,. 
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Il sistema di radici X si ritrova a partire da un oggetto più semplice, formato 
da II e da tutti i numeri {x, B}, «,Bell: ogni biiezione IT+II' che conserva 
questi numeri si estende a un isomorfismo fra i corrispondenti sistemi di radici. 

Infine il numero {x, B} è determinato dall'angolo fra « e } e dalla cono- 
scenza del vettore di modulo maggiore. Dalle proprietà del sistema di radici si 
può dedurre che, se x34 +3, gli angoli possono assumere soltanto 1 seguenti 
valori: (0) 90°; (1) 60° oppure 1209; allora |x|=]|B|; (2) 45° oppure 1359; 
|a] /{B!= 5 (3) 300 oppure 1509; allora |a]/18]= v3. 

L’oggetto combinatorio (II, {x,B}) è utilizzato nelle rappresentazioni con 
diagrammi di Dynkin, nelle quali si presenta come un grafo con le seguenti pro- 
prietà: i vertici rappresentano gli elementi di IT; due vertici sono uniti da î spi- 
goli se i è il numero del punto che nel capoverso precedente descrive l’angolo; 
se |a|>]B], sullo spigolo corrispondente si traccia una freccia diretta verso 8. 

Dopo questo teorema di classificazione dei sistemi di radici si può afferma- 
re che la figura 5 riportata nell’articolo «Invariante», VII, p. 929, di questa 
stessa Enciclopedia mostra tutti i diagrammi di Dynkin dei sistemi irriducibili 
di radici. 

Il legame con i gruppi classici è il seguente: 4,=Z(SU(2+1)), B,= 
=%Z(SO(2n-+1)), C,=2(Sp(n)), D,=2(S0O(22)). [.m.G. e Ju.I.M.]. 


Gerskovit, F. M. 
1979 Ob odnoj invencii Ioganna Sebast'jana Bacha. (K voprosu o projschozdenii klassiteskoj 
venskoj sonatnoj formy), in «Trudy po znakovym sistemam», XI, pp. 44-70. 
Hofstadter, D., e altri 
1979 An Eternal Golden Braid, Basic Books, New York. 
Klein, F. 
1872 Vergleichende Betrachtungen iiber neuere geometrische Forschungen. Programm zum Ein- 
tritt in die philosophische Facultàt und den Senat der k. Friedrich- Alexanders- Universitàt 
zu Erlangen, Deichert, Erlangen (trad. it. in « Annali di Matematica», serie II, XVII 
(1889), pp. 307-49). 
Lee, T. D. 
1970 Symmetry Principles in Physics and Finite Quantum Electrodynamics, Centro de Investi- 
gaciòn y de Estudios Avanzados del Instituto Politécnico Nacional, México. 


Weyl, H. 
1952 Symmetry, Princeton University Press, Princeton N.J. (trad. it. Feltrinelli, Milano 
1962). 


La nozione, in origine piuttosto vaga, di simmetria come armonia di proporzioni, 
permea le più varie manifestazioni culturali (cfr. cultura/culture), dai canoni della 
bellezza e della salute del corpo alle produzioni delle arti, dallo studio del vivente (cfr. 
individualità biologica, organismo, vita) alle immagini (cfr. immagine) del mon- 
do (cfr. anche cosmologie, universo). Nel contesto della fisica le diverse concezioni 
della simmetria sono via via slittate dal piano della rappresentazione globale (cfr. lo- 
cale/globale) delle prime forme di pensiero razionale emergenti dal mito (cfr. mythos/ 
logos) e delle grandi «architettoniche» di idee della metafisica, a modellizzazioni più 
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locali (cfr. modello, teoria/modello) dei fenomeni della natura. La rappresentazione 
matematica dello spazio-tempo, la progressiva messa in luce di «principî di conserva- 
zione » (cfr. conservazione/invarianza), la sostituzione dell’antica teoria degli elemen- 
ti con quella delle particelle elementari (cfr. particella) come premessa per la conce- 
zione moderna della materia e dell'energia, hanno fatto si che le considerazioni in ter- 
mini di simmetria svolgessero un ruolo sempre più rilevante sia nella teoria dei quanti 
sia nella relatività: del resto, lo studio delle «rotture della simmetria » è oggi uno stru- 
mento essenziale per una teoria unificata (cfr. uno/molti, unità) nelle varie interazioni 
fondamentali (cfr. forza/campo, interazione). L'elaborazione entro le matematiche 
si è proficuamente intrecciata a questa evoluzione del paradigma fisico, come l’indagine 
matematica di quel che è invariante rispetto a un gruppo di trasformazioni sta a indi- 
care (cfr. anche applicazioni, dualità, funzioni). La trattazione delle simmetrie a un 
notevole livello d’astrazione (cfr. astratto/concreto) nelle varie strutture matemati- 
che consente infine più adeguate concettualizzazioni per ogni sistema in cui pare ri- 
levante l’idea di generazione ricorsiva (cfr. ricorsività) di una struttura complessa (cfr. 
semplice/complesso) per mezzo dijun piccolo numero di regole (cfr. formalizzazio- 
ne, grammatica, logica). 
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Strutture matematiche 


1. Note introduttive. 


1.1. L’uso comune del termine e lo strutturalismo. 


La parola ‘struttura’ viene ampiamente utilizzata nelle matematiche, per 
esempio in locuzioni come ‘struttura di gruppo’ o ‘struttura di spazio topolo- 
gico’. Questo termine appartiene però a un livello talmente elevato che già di 
per sé riflette nella sostanza un’astrazione metateorica. È bene allora confrontare 
il suo contenuto con l’idea più vaga di struttura che si trova invece nelle altre 
scienze: Lo scopo di queste note introduttive è proprio quello di delineare tale 
confronto. 

Il ruolo dello «strutturalismo», come principio metodologico della scienza 
del xx secolo, può essere significativamente paragonato a quello dell’«evoluzio- 
nismo» nella scienza del x1x secolo. I concetti della coppia struttura/evoluzione 
formano una delle opposizioni fondamentali entro le concezioni razionalistiche 
della conoscenza, che è a sua volta strettamente legata all’opposizione spazio- 
tempo. Semplificando al massimo, si può dire metaforicamente che l'evoluzione 
del sistema è la sua struttura nel tempo, mentre la struttura è l’evoluzione nello 
spazio. In realtà la situazione è più complessa. L'organismo biologico non evol- 
ve, si sviluppa soltanto. La specie può evolvere; ma la specie non è il fattore 
biologico primario, è un’astrazione, oltre tutto un’astrazione che si riferisce alla 
sfera descrittiva della struttura del mondo vivente del pianeta. Quindi l’evolu- 
zione biologica non è la storia del mondo vivente, ma la storia della sua struttu- 
ra. A sua volta, la descrizione strutturale, ad esempio della lingua swahili, non 
è la descrizione di una parte o di tutti i fatti linguistici compiuti in un dato lasso 
di tempo. Essa include la formulazione. di regole che operano in un dato momen- 
to, le quali consentono di costruire testi di una lingua accettabili grammatical- 
mente, di interpretarli, di confrontarli con le situazioni, ecc. La descrizione 
strutturale fissa piuttosto lo spazio delle possibilità che l’elenco delle loro rea- 
lizzazioni, e il motivo principale per cui tale azione fissante può in generale es- 
sere svolta consiste nel fatto che lo spazio delle possibilità evolve lentamente, 
è cioè stabile nel tempo. Quando la lingua evolve, questo spazio cambia; il 
cambiamento degli atti discorsivi si compie molto più rapidamente e non am- 
mette un confronto diretto con l'evoluzione. 


1.2. Struttura ed evoluzione: loro complementarità. 


Già questa breve analisi mostra che i concetti di struttura/evoluzione si tro- 
vano in tipico rapporto di complementarità alla Bohr (cfr. l'articolo « Dualità » 
in questa stessa Enciclopedia) e, come spesso avviene nelle coppie complemen- 
tari dei principî metodologici della scienza, intere scuole, e talvolta anche intere 
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epoche, sono legate, nella loro visione scientifica del mondo, a un’esagerata con- 
siderazione di uno dei principî a detrimento dell’altro. Questo eccesso è tal- 
volta esplicitamente teorizzato e i suoi vantaggi si pretendono solennemente 
confermati da risultati concreti; talvolta esso è inconscio e può essere ricostrui- 
to solo dallo storico della scienza. Il x1x secolo ha proclamato in biologia, geo- 
logia, linguistica la propria concezione dell’evoluzione in maniera pienamente 
consapevole e, dopo Darwin, si è occupato molto più dell’evoluzione delle di- 
verse strutture che delle strutture evolventi. Fra i maggiori pensatori che hanno 
preparato la svolta verso lo strutturalismo del nostro secolo sono da annoverare 
il fisico Maxwell e il linguista Saussure. 

All’alba dell’atomismo scientifico Maxwell ha posto il problema di come la 
natura, a livello atomico, non conosca evoluzione, e comunque le concezioni 
evoluzionistiche non siano in grado di spiegare l’esistenza né la forma delle leggi 
fisiche oggi note. In particolare Maxwell ha scritto: « Di conseguenza ogni mo- 
lecola, in tutto l'universo, porta su di sé il marchio di un sistema metrico tanto 
preciso quanto quello del metro delle Archives Nationales o del doppio cubito 
regale del tempio di Karnak. Non è possibile costruire alcuna teoria evoluzioni- 
stica in grado di rendere conto della somiglianza delle molecole, giacché l’evo- 
luzione sottintende necessariamente un cambiamento continuo, mentre una mo- 
lecola non è capace né di crescita, né di decadenza, né di generare né di distrug- 
gere» [citato in Coulson 1962, p. 746]. 

D'altra parte la grande scoperta di Maxwell è stata quella di introdurre nella 
fisica un elemento strutturale di tipo nuovo, il campo. Lo studio dettagliato svol- 
to da Maxwell sulle equazioni del campo elettromagnetico e la loro interpreta- 
zione fisica ha aperto la strada alle concezioni di campo della teoria quantistica 
e della gravitazione. Riunite in una cosmologia teorica, queste concezioni hanno 
portato a una teoria evoluzionistica del mondo fisico (in particolare degli atomi) 
di una portata che Maxwell non aveva potuto prevedere. D'altra parte la sco- 
perta dell’invarianza delle equazioni di Maxwell relativamente al gruppo di 
Poincaré ha condotto successivamente all’unificazione di spazio e tempo in un 
unico continuum quadridimensionale. Nelle costruzioni della fisica teorica ciò 
ha significato per lo meno la fusione dei concetti di struttura e di evoluzione, 
cosa mai avvenuta prima. 

Lo strutturalismo nelle scienze umane del xx secolo deve a Ferdinand de 
Saussure l’introduzione di alcuni concetti fondamentali fra cui appunto l’op- 
posizione struttura/evoluzione, che Saussure, nel Cours de linguistique générale 
(1906-11), sulla base di materiale linguistico espone sotto forma della nota cop- 
pia oppositiva sincronia/diacronia. Le idee di Saussure sulla sistematicità della 
lingua sul piano sincronico sono state sottoposte a riproduzione industriale qua- 
si di massa e a standardizzazione divenendo, per questa loro qualità, strumento 
di lavoro per filologi, linguisti ed etnologi del nostro tempo. 


767 Strutture matematiche 


1.3. Un cenno allo strutturalismo etnologico e linguistico. 


È opportuno qui notare che, analizzando il concetto di struttura, è possi- 
bile individuare fra i suoi innumerevoli impieghi due estremi del significato. 
Il primo si riferisce al riconoscimento di una qualche unità e reciprocità delle 
parti che formano il tutto, in applicazione agli oggetti reali della conoscenza 0, 
esprimendosi con maggior cautela, in applicazione agli atti di pensiero che for- 
mano l’oggetto della conoscenza. Il'secondo appare quando viene applicato ai 
costrutti linguistici e simbolici che oggettivizzano l’atto del pensare e sono chia- 
mati ad esprimere una concezione teorica degli oggetti della conoscenza. 

La non-assolutezza di questa contrapposizione è evidente giacché l’atto del 
pensare che forma l’oggetto è esso stesso oggettivizzato nella costruzione lingui- 
stica, e inoltre la concezione teorica può diventare, e diventa a sua volta, oggetto 
di conoscenza a un grado successivo. Questa gerarchia di strutture si manifesta 
ad esempio nell’approccio alle concezioni dello strutturalismo etnologico legato 
in primo luogo al nome di Lévi-Strauss. La primitiva attività mitica, secondo 
Lévi-Strauss, rappresenta, in misura considerevole, lo strumento logico per 
chiarire le fondamentali contrapposizioni binarie, «i dati della realtà», e la loro 
soluzione dialettica, in particolare grazie a identificazioni diverse, trasposizioni 
e mediazioni. D'altra parte la stessa concezione di Lévi-Strauss, nel più ampio 
contesto dello strutturalismo linguistico e della critica letteraria, può essere sot- 
toposta ad analisi da un teorico della scienza, il quale scoprirà in essa la pre- 
senza particolare dei principî costruttivi del testo scientifico che influenzarono 
nel xx secolo logici, linguisti e matematici. 


1.4. Matematica e strutturalismo. 


La matematica, infine, ha recato un contributo particolare all’ideologia dello 
strutturalismo, costituendo il modello (sia per imitazione sia per repulsione) di 
una disciplina che, mentre è altamente strutturalizzata, crea anche un proprio 
linguaggio descrittivo, potenzialmente di qualunque strutturalizzazione. Tenu- 
to conto dell’«apertura di significato» delle espressioni matematiche, più volte 
sottolineata in altri articoli, cioè della possibilità di un ricco spettro per le in- 
terpretazioni concrete, questo linguaggio per descrivere le strutture è diventato 
un modello quasi universale. L’autocoscienza della matematica si manifesta nel- 
la creazione di un modello di se stessa al proprio interno: un’immagine ideale 
della matematica come gerarchia di linguaggi logici o dei loro referenti all’in- 
terno di concezioni di teoria degli insiemi o di altro tipo. La scoperta di tratti 
comuni in costruzioni matematiche diverse, la loro reciproca correlazione e il 
loro carattere iterativo hanno prodotto cosi una certa immagine dell’universo 
matematico. In questa immagine un ruolo di primo piano è svolto dal concetto 
concretizzato e precisato di «struttura matematica», al quale appunto è dedi- 
cato questo articolo. 
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2. Le strutture secondo Bourbaki: principî generali. 


2.1. Bourbaki e l'emergenza del concetto di struttura matematica. 


L'espressione ‘strutture matematiche’ è stata introdotta, dotata di contenu- 
to e divulgata dal gruppo di matematici francesi noti sotto lo pseudonimo col- 
lettivo di Nicolas Bourbaki. Il concetto di struttura matematica, insieme a un 
piccolo numero di astrazioni metateoriche di alto livello (come il «metodo as- 
siomatico »), è stato posto da questo gruppo a fondamento dell’attuale soluzione 
del problema dell’unità delle nozioni matematiche. L’idea di struttura matema- 
tica fornisce la chiave per la comprensione e la consapevole rielaborazione ar- 
chitettonica dell’universo matematico; il possesso del metodo assiomatico per- 
mette di orientarsi nei suoi spazi infiniti. Per questo, parlando di strutture ma- 
tematiche, non si può trascurare la descrizione della matematica vista con gli 
occhi di Bourbaki, benché si possa e si debba tener conto dei cambiamenti di 
prospettiva. 


2.2. Il problema dell’unità delle matematiche. 


Il problema dell’unità della matematica non è nuovo; si è posto fin dall’epo- 
ca in cui la matematica si è configurata come disciplina autonoma. Percorrendo 
i tentativi storici di risolvere tale problema, si scopre che le divergenze sono 
iniziate al momento di definire l’oggetto delle scienze matematiche. Le scienze 
naturali si occupano del mondo esterno escludendone, per quanto possibile, 
l’uomo; le scienze umane individuano il posto dell’uomo nel mondo esterno e 
nella società dei suoi simili; ma quali problemi pone la matematica e qual è il 
senso delle risposte che essa dà? 

Non v'è alcun dubbio che una serie di concetti fondamentali della matema- 
tica, quali «numero» e «figura», «derivata» e «integrale», risalgano a rappre- 
sentazioni della fisica, ma se i teoremi matematici che vi si riferiscono permetto- 
no un’interpretazione fisica diretta, più spesso numerose interpretazioni fisiche 
mettono in luce analogie insospettate e affinità tra i vari fenomeni del mondo 
esterno. Tale constatazione può indurre a considerare la matematica come un 
linguaggio ausiliario delle scienze naturali (soprattutto della fisica), che vive so- 
lo in quanto le scienze naturali gli garantiscono un «senso» e un’«applicazione». 

Quasi altrettanto evidente è però anche un’altra particolarità caratteristica 
della matematica che induce a considerare con maggiore attenzione la sua pa- 
rentela con le scienze dell’uomo. Neppure il frammento più piccolo del linguag- 
gio matematico ha una funzione meramente descrittiva, nemmeno nelle appli- 
cazioni alle scienze naturali. Le premesse possono avere un’interpretazione spe- 
rimentale e una giustificazione; le conclusioni possono essere verificate per via 
sperimentale o falsificate; ma fra le une e le altre, nel corso della deduzione, che 
costituisce l'essenza stessa del metodo matematico, avviene qualcosa che non 
sottostà al confronto diretto con una realtà descrivibile. 
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Questa deduzione si compie nei casi più semplici, come si vedrà in seguito 
nell'esempio dell’aritmetica elementare, all’interno di un sistema simbolico, la 
cui potenziale applicabilità al mondo esterno è assicurata dall’interpretazione 
operazionale in termini di enumerazione di oggetti materiali, di aggiunta di una 
quantità di oggetti materiali a un’altra, ecc. Tuttavia un ben noto paradosso con- 
siste nel fatto che nella maggioranza delle applicazioni reali del simbolismo non 
ci sono oggetti materiali, né processi fisici che rispondano a queste procedure 
di enumerazione e di aggiunta, e questi oggetti e processi non possono essere 
neppure pensati come insospettabili intermediari di un processo fisico concreto. 

Per rendere più chiaro questo pensiero, si consideri un esempio tratto da 
un testo di scienza naturale. «g. Produzione di energia di una pila. Il numero di 
fissioni prodotte per cm3 per secondo in una pila è (f,r0/A)(3,9/7,2), dove i fat- 
tori sono: la frazione di termici assorbita dall’uranio, la densità dei neutroni, 
il reciproco della vita di un neutrone termico, e la frazione di neutroni assorbita 
dall’uranio che ha condotto alle fissioni. Assumendo 200 Mev per fissione, dob- 
biamo moltiplicare il numero di fissioni/sec cm* per 200 Mev/fissione = 0,00032 
erg/fissione per ottenere erg/sec cm?. Nell’espressione che ne deriva appare il pro- 
dotto 9, il flusso. Dovremmo però usare il flusso medio #9, e si può mostrare 
che per un cubo esso è legato a #7, il flusso al centro, dall’equazione 79= 
=n0(8/78). Infine, kW =w00[(8/r9)V(f/A)(3,9 x 3,2/7,2) 10714]. Sostituen- 
do i numeri appropriati, questa espressione vale approssimativamente (4X 
x 107?) n. Si possono ottenere delle potenze dell'ordine di 2,5 x 108 kW (a 
Clinton) e questo significa che il flusso al centro è approssimativamente di 104!?, 
A Hanford i flussi di neutroni al centro delle pile sono approssimativamente di 
10!8n/sec cm?» [Fermi 1945, pp. 531-32]. 

Si tratta di una breve descrizione di uno dei calcoli tecnologici legati alla 
conoscenza dell’energia atomica, simbolo del nostro secolo. La semantica ester- 
na di questo testo è molto complessa: collega le astrazioni profonde della fisi- 
ca («reciproco della vita di un neutrone termico ») con le concrete elaborazioni 
ingegneristiche. Il contenuto matematico, invece, si riduce quasi all’aritmetica 
elementare; in particolare, per ottenere il risultato finale occorre semplicemente 
moltiplicare 8/x:® per (3,9/7,2) 3,2, mantenendo due-tre cifre significative del 
risultato. Eppure proprio in queste operazioni aritmetiche, che costituiscono l’e- 
sempio più semplice di deduzione, si riflette, come in una goccia d’acqua, uno 
dei misteri della scienza matematica: che rapporto hanno con il reattore atomi- 
co le operazioni comuni segnate sul foglio, la moltiplicazione 2 x 9, il riporto 
dell’avanzo nella colonna successiva, ecc.? Lo svolgimento di questi conti sul 
calcolatore rende ancora più evidente la paradossale assenza di parallelismo fra 
i processi fisici che avvengono nel corso del calcolo e quei processi fisici il cui 
risultato o le cui caratteristiche hanno come modello questo calcolo. 

Ogni deduzione matematica sottintende la subordinazione di una catena di 
inferenze alle regole della logica, la spiegazione di costruzioni linguistiche che 
risultano legittime, in breve l'osservanza di alcune leggi di carattere linguistico. 
Che rapporto c’è fra queste esigenze di una corretta costruzione del testo ela 
speranza di una verità delle inferenze rispetto al contenuto? 
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2.3. Filosofia della matematica e strutture matematiche. 


La filosofia della matematica, esterna rispetto alla matematica stessa, pre- 
suppone risposte diverse a queste domande e, di conseguenza, soluzioni diverse 
al problema dell’unità delle conoscenze matematiche. Il platonismo suppone 
che, come la natura, anche la matematica dell’uomo sia il riflesso prestabilito 
di un mondo ideale posto al di sopra di entrambi. Il realismo suppone che il 
cervello umano, in quanto parte della natura, sia portatore dell’impronta com- 
plessa e mutevole di un grande mondo, il che spiega anche la concordanza dei 
nostri processi cognitivi sia all’interno della loro struttura organizzativa sia nel 
loro rapporto con questo mondo. 

Proprio i pensatori che hanno usato più efficacemente la matematica per co- 
noscere la natura sono inclini a lasciare senza risposta la questione delle cause 
di questa efficacia. Lo stesso Maxwell scrive: « Chi mi condurrà in quella regio- 
ne ancor più segreta e nebbiosa in cui il Pensiero si sposa al Fatto, in cui l’o- 
perazione mentale del matematico e l’azione fisica delle molecole appaiono nella 
loro vera connessione? Non passa forse tale strada attraverso la tana del metafi- 
sico, disseminata delle ossa dei ricercatori precedenti, e verso cui tutti gli uo- 
mini di scienza provano disgusto?» [citato in Coulson 1962, p. 745]. 

Il concetto di «struttura matematica» è il risultato del tentativo fatto per 
raggiungere una meta assai più modesta di quella che si propone qualunque 
altra filosofia universale della matematica. Tale meta non consiste nel voler spie- 
gare i successi del pensiero matematicizzato, ma solo nel catalogare e sistema- 
tizzare i suoi metodi. 

Il gruppo Bourbaki fu costituito da professionisti di prim'ordine; la mate- 
matica vi era considerata dall’interno, nella sua viva integrità e nelle sue nuove 
tendenze di sviluppo. Un ruolo non indifferente nell’impostazione del proble- 
ma sull’organizzazione delle conoscenze matematiche e nella soluzione proposta 
fu svolto da considerazioni pedagogiche del tutto ovvie. Quando intraprese la 
propria attività Bourbaki era giovanissimo. Un giovane matematico si trova di 
fronte alla necessità psicologica di capire che cosa abbiano in comune, ad esem- 
pio, la teoria della somma di variabili casuali indipendenti, che gli viene espo- 
sta nel corso di calcolo delle probabilità, e la classificazione delle forme quadra- 
tiche del corso di algebra lineare. L’istruzione universitaria con la sua tradizio- 
nale suddivisione della matematica in analisi, algebra e geometria ha contribui- 
to, e in gran parte contribuisce tutt'ora, alla formazione di specialisti ristretti, 
esperti solo nella formalizzazione di una disciplina e capaci di usare un ristretto 
numero di procedimenti per risolvere problemi simili ad altri già risolti. Lo 
scienziato che si forma e che desidera ampliare le proprie conoscenze e svol- 
gere i propri impegni professionali con maggior efficacia ha bisogno di una chia- 
ra formulazione dei principî generali di costruzione della propria scienza, i quali 
agiscano da principî sia organizzativi sia creativi. 
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2.4. Il «paradigma» bourbakista. 


Una concezione che soddisfa questa esigenza è stata realizzata negli ultimi 
quarant'anni proprio dal gruppo Bourbaki. L’inizio della sua attività si col- 
loca negli anni ’30; nella cerchia dei fondatori rientravano André Weil, Jean 
Dieudonné, Claude Chevalley. Questo gruppo ha una composizione variabile, 
soprattutto per l’accordo di ritirarsi al compimento dei cinquant’anni. Frutto 
concreto del suo lavoro è il corso in più volumi sugli E/éments de mathématique, 
uscito a partire dal 1939 e che conta attualmente alcune decine di volumi, in- 
cluse le edizioni ampiamente riviste. In minor numero sono stati pubblicati 
singoli articoli firmati Bourbaki; particolare attenzione merita il famoso lavoro 
programmatico L’architecture des mathématiques [1948], che espone brevemente 
i principî fondamentali degli autori. Altra straordinaria produzione di questo 
gruppo sono i lavori del seminario Bourbaki, la cui pubblicazione è iniziata nel 
1948. Negli ultimi tempi si tengono tre sessioni di seminari l’anno, in febbraio, 
in giugno e in novembre; ogni sessione comprende una mezza dozzina circa 
di conferenze, i cui testi vengono preparati in precedenza e pubblicati successi- 
vamente. Attualmente le conferenze pubblicate sono più di cinquecento. Se gli 
Eléments de mathématique [1939 sgg.] possono essere considerati un corso siste- 
matico universale di scienze inatematiche di tipo superiore, che espone i con- 
cetti fondamentali e i teoremi in ordine logico e col dovuto grado di generalità, 
le pubblicazioni del seminario Bourbaki rappresentano la più ricca cronaca degli 
ultimi progressi in tutti i campi concreti della matematica. Nello stesso tempo, 
queste pubblicazioni si differenziano da qualunque rivista matematica ordinaria 
non specialistica. Poiché i lavori del seminario costituiscono in misura conside- 
revole una selezione ulteriore delle pubblicazioni, la scelta stessa dei temi e la 
loro formulazione nelle relazioni risultano una chiara espressione del sistema di 
valori e dell’estetica di Bourbaki. Queste pubblicazioni influenzano l’attività dei 
matematici forse anche più degli Elements, a cui, dopo gli anni studenteschi, ci 
si rivolge come a un manuale informativo. Una rassegna di matematica rifles- 
sa nello specchio del seminario Bourbaki è stata pubblicata da Jean Dieudonné 
[1977]. 

Si è ritenuto necessario dedicare un certo spazio alla descrizione di partico- 
lari storici legati alla comparsa del concetto di «struttura matematica», giac- 
ché questo concetto porta in sé il marchio del nostro tempo e non si è ancora 
tanto cristallizzato da diventare impersonale, né è tanto relegato al passato da 
presentare un interesse esclusivamente storico. In realtà l’attività del gruppo 
Bourbaki, vista come processo, ha un interesse straordinario per il sociologo 
della scienza interessato alla formazione e al primo periodo di vita dei paradig- 
mi scientifici nel senso di Thomas Kuhn (cfr. l'articolo «Paradigma» in questa 
stessa Enciclopedia). In questo esempio sono visibili molti tratti caratteristici 
di tale processo. Purtroppo l’attività di Bourbaki è trattata dai sociologi della 
scienza molto meno di quanto meriti; la fonte principale delle informazioni qui 
riportate sono gli articoli di Halmos [1957] e di Dicudonné [1969]. Halmos di- 
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pinge a grandi linee il ritratto psicologico collettivo di una forte personalità po- 
liedrica e creativa, l’impazienza e l’acutezza d’ingegno appena attenuata da un 
vivo senso dell’umorismo. Un ricercatore scientifico deciso a dedicarsi alla de- 
scrizione di questo fenomeno eccezionale deve possedere notevoli qualità in- 
tellettive e coraggio personale. 


2.5. Metodo assiomatico e pratica matematica. 


Il concetto di struttura si sviluppa, secondo Bourbaki, sulla base dell’uni- 
ficazione di due aspetti sostanziali del ragionamento matematico. Il primo è una 
rigorosa sistematizzazione dell’attività linguistica della matematica che si espri- 
me nella prevalenza del «metodo assiomatico ». Come si spiega dettagliatamen- 
te nell’articolo « Assioma/postulato » di questa stessa Enciclopedia, questo meto- 
do si basa sul fatto che il matematico parte da un sistema fissato di premesse 
alle quali applica in seguito una successione di passi logici elementari, che co- 
stituisce il metodo deduttivo. Anche l’elenco di questi passi viene catalogato. 
Tuttavia, come rileva Bourbaki, «il metodo delle considerazioni, racchiuso nella 
costruzione di una catena di sillogismi, è solo un meccanismo trasformazionale, 
applicabile indifferentemente a qualunque tipo di premesse e che, di conseguen- 
za, non può caratterizzare la loro natura. In altri termini, si tratta della forma 
esterna che il matematico dà al proprio pensiero, lo strumento che la rende in 
grado di collegarsi a altri pensieri e, per cosi dire, il linguaggio inerente la ma- 
tematica, ma nient'altro. Ordinare il vocabolario di questo linguaggio e preci- 
sare la sua sintassi significa fare un lavoro molto utile, che costituisce in effetti 
uno degli aspetti del metodo assiomatico, quello che si può propriamente chia- 
mare formalismo logico (oppure, come si dice, ‘‘logicista’’). Ma, e su questo si 
insiste, si tratta solo di un aspetto, e il meno importante » [1948, ed. 1962 p. 37]. 

La sistemazione del vocabolario e della sintassi del linguaggio matematico 
sono state oggetto d’interesse di alcune generazioni di matematici. Le principali 
tappe di questo lavoro sono legate ai nomi di Boole, Bolzano, Cauchy, Dedekind, 
Cantor, Peano, Frege, Russell e Whitehead, Hilbert, Bernays, Zermelo, Géòdel. 
L’incompletezza di qualunque formalizzazione rilevata da Gédel, che si espri- 
me nella mancanza d’identità fra deduzione formale e verità, ha portato una 
schiera di matematici a conclusioni pessimistiche riguardo al senso e al valore 
dell’astrazione matematica fondamentale: l’idea di infinito attuale su cui pog- 
gia il concetto di verità. Di fronte al rifiuto di questa idea una delle possibili 
concezioni positive consiste proprio nel sostenere le proprietà di «meccanismo 
trasformazionale >» della deduzione, il carattere algoritmico, la computabilità e 
altre simili «proprietà meccaniche » del ragionamento matematico. Per questo 
Nicolas Bourbaki, che sostiene il punto di vista opposto, è costretto a insistere 
— e con buoni argomenti — sul fatto che queste proprietà meccaniche rappre- 
sentano solo la parte meno interessante del metodo assiomatico. In realtà l’im- 
magine idealizzata della matematica come processo generativo di tutte le dedu- 
zioni formali derivanti da un sistema accettato di assiomi non è semplicemente 
lontana dalla realtà, ma non coglie un aspetto essenziale della realtà stessa: non 
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riflette il principio della scelta (o generazione selettiva) delle deduzioni utili e 
produttive rispetto a un oceano di ragionamenti implausibili, anche se formal- 
mente corretti. Certamente essa non riflette neppure il processo di formazione 
storica concernente la scelta e il cambiamento degli assiomi accettati o la ge- 
nesi dei concetti fondamentali nei cui termini questi assiomi sono formulati. 
Qualunque concezione che tenga conto di queste caratteristiche essenziali pre- 
suppone più o meno chiaramente l’accettazione di un sistema di valori che pre- 
siedano alla scelta. Se per le tendenze costruttiviste questi principî si riducono 
all’ideale affidabilità dei giochi finitistici combinatori, e per quelle intuizionisti- 
che si basano su criteri di convinzione intuitiva non completamente definiti, per 
Bourbaki è determinante la fiducia del matematico nel valore e nella fondatezza 
di tutto il patrimonio della matematica classica e del suo moderno sviluppo. Un 
po’ meno preciso è l'atteggiamento di Bourbaki nei confronti del problema del 
mutuo rapporto fra mondo sperimentale e mondo matematico. Come molti al- 
tri pensatori, fra cui i fisici Eugene P. Wigner e Richard Ph. Feynman, Bour- 
baki constata che per descrivere i fenomeni della natura, in particolare del mi- 
cromondo, risultano inaspettatamente necessarie le costruzioni matematiche che 
compaiono come risultato di una logica interna di sviluppo e che non hanno si- 
curamente una «diretta»-origine sperimentale. Bourbaki respinge ogni spiega- 
zione; è fuori dubbio tuttavia che il periodico inserimento di strutture matema- 
tiche nel mondo delle scienze naturali, soprattutto della fisica teorica, serve a 
Bourbaki da conferma dei principî di valore che ha adottato. 

L’analisi della matematica classica intrapresa da Bourbaki porta anzitutto a 
rivedere ciò che conviene considerare come suo sistema di concetti fondamen- 
tali (dal punto di vista del loro contenuto si dà per scontato che la struttura lo- 
gica del linguaggio matematico sia già stata analizzata). Si è già ricordato che 
nella matematica classica l’idea di «numero reale » appartiene ai concetti fonda- 
mentali. La differenza fra l'approccio «logicistico » e l'approccio di Bourbaki si 
può opportunamente rilevare sull’esempio dell’elaborazione di quest'idea. In ma- 
niera breve e concisa, l’analisi logica di un numero reale porta alla sua «aritmetiz- 
zazione»: si chiarisce che, in qualità di concetto primitivo, è possibile prendere 
l’insieme dei numeri naturali col relativo sistema descrittivo di assiomi di Pea- 
no; quindi una serie di successive costruzioni insiemistiche conduce dai numeri 
naturali agli interi, ai razionali, e infine ai reali (per mezzo delle sezioni di Dede- 
kind o del completamento secondo Cantor). Con ciò l’analisi logica termina, se 
tutti i principî logici e insiemistici esplicitati durante il suo svolgimento sono 
riconosciuti come veri; la teoria dei numeri reali può essere quindi separata dal- 
l’aritmetica e fissata in un corso, come avviene nel classico corso di Landau 
[1930]. Se però i principî esplicitati non sono riconosciuti validi, possono essere 
sostituiti da altri; tutto l’edificio delle considerazioni è sottoposto a rielabora- 
zione e conduce a concezioni alternative dei numeri reali, ad esempio secondo 
Brouwer, Heyting oppure Markov. 

L’analisi secondo Bourbaki segue un altro progetto. Si studiano le proprietà 
dei numeri reali che sono utilizzate ad esempio nelle dimostrazioni dell’analisi 
classica. Si scopre che queste proprietà si suddividono in modo naturale in tre 
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gruppi nettamente distinti (si tornerà su questo argomento in seguito, nella de- 
scrizione delle «strutture generatrici»): 


a) Proprietà algebriche. Ne fanno parte le leggi per la somma e il prodotto: 
associatività, commutatività, distributività... tutti i numeri rispetto alla 
somma e tutti i numeri diversi da zero rispetto al prodotto formano un 
gruppo. In particolare sono conseguenze di queste proprietà tutte le iden- 
tità «letterali» dell'algebra elementare, tipo il binomio di Newton. 

b) Proprietà di ordinamento. I numeri reali sono dotati di una relazione bi- 
naria di ordine, relazione che entra in numerose disuguaglianze e mag- 
giorazioni dell’analisi classica. 

c) Proprietà topologiche. Su queste si basano la definizione di continuità 
delle funzioni, tutte le costruzioni del calcolo differenziale legate al pro- 
cesso di passaggio al limite, la proprietà di compattezza di un intervallo 
chiuso, ecc. 


Con ciò è chiaro che ciascuno dei tre gruppi di proprietà non è specifico 
della sola teoria dei numeri reali: ciò che è specifico è soltanto che tutti e tre 
sono imposti contemporaneamente sul medesimo insieme (cfr. del resto quan- 
to osservato nell'articolo «Calcolo» di questa stessa Enciclopedia, II, pp. 393, 
396 e 417-18). Si consideri, ad esempio, un insieme astratto con due leggi di 
composizione, somma e prodotto, che siano commutative, associative, distri- 
butive e che costituiscano un gruppo rispetto alla somma in tutto l’insieme e 
rispetto al prodotto in tutti gli elementi diversi dallo zero del gruppo additivo. 
Un tale insieme si dice campo o corpo (astratto). Il campo o corpo ha nume- 
rose proprietà algebriche comuni ai numeri reali e, in particolare, in esso si ve- 
rificano le identità dell'algebra elementare. Ma una simile classe di oggetti con- 
tiene anche campi del tutto diversi: i numeri razionali, algebrici e complessi, i 
campi finiti di Galois, i campi di funzioni razionali in uno o più argomenti, ecc. 
(si vedano gli articoli « Applicazioni» e «Razionale/algebrico/trascendente» in 
questa stessa Enciclopedia). Se poi il concetto di campo si riduce immediata- 
mente al fatto che su uno stesso insieme vengono contemporaneamente impo- 
ste due strutture di gruppo commutativo, è chiaro che più fondamentale risulta 
il concetto di gruppo, che in genere deve essere studiato dettagliatamente pri- 
ma di considerare i campi, Infine, un gruppo è un insieme con una legge di 
composizione binaria dotato di proprietà particolari (associatività, esistenza del- 
l’unità e dell'elemento inverso), e lo studio dei gruppi dev'essere preceduto dal- 
lo studio delle proprietà delle leggi di composizione, che sono dotate di un minor 
numero di condizioni. 

L'utilità di quest’approccio si basa sul fatto che, diminuendo la quantità di 
proprietà iniziali assunte per gli oggetti, aumenta la quantità di oggetti che rien- 
trano sotto la stessa considerazione e, liberandosi dall’ipnosi delle proprietà par- 
ticolari di una situazione concreta, si comincia a vedere la profonda generalità 
e l’analogia fra oggetti matematici apparentemente indipendenti. Si facilita il 
passaggio di un’idea da un campo all’altro, giacché una considerazione suggeri- 
ta dalle particolarità di'una situazione può essere applicabile a un caso molto 
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più generale in cui tuttavia l’intuizione che l’ha generata non trova nutrimento. 
Ad esempio la conoscenza delle proprietà topologiche dei numeri reali in quan- 
to tali, prescindendo dalla concreta topologia reale, conduce all’idea di chiarire 
se nell'insieme dei numeri razionali non vi siano altre definizioni di «vicinanza» 
che possano essere usate per il completamento di questo campo, diverso dal 
completamento reale. Hensel scopri queste definizioni, le topologie p-adiche; 
Ostrowski dimostrò che oltre a quella reale esse esauriscono le topologie natu- 
rali; e in seguito a lavori di Chevalley e Artin la considerazione congiunta di 
tutte le topologie è diventata lo strumento fondamentale dell’aritmetica, consi- 
derata per molti secoli il regno del discreto (cfr. del resto quanto osservato in 
questa Enciclopedia negli articoli «Geometria e topologia», VI, pp. 695 sgg.; 
«Numero», IX, pp. 939 sgg.). 

Va sottolineata una particolarità dell’analisi, qui brevemente tratteggiata. 
Passando dalla considerazione di un oggetto concreto — i numeri reali — alla 
considerazione delle sue «proprietà» isolate, ci si trova di fronte all’alternativa 
di come intendere queste proprietà: come espressioni puramente linguistiche, 
o in modo estensionale, come classe di oggetti insiemistici dotati di queste pro- 
prietà? Nell’articolo «Insieme» di questa Enciclopedia si è cercato di spiegare 
che in realtà vanno considerati in modo complementare entrambi gli aspetti. 
Nella matematica contemporanea l’aspetto concettuale si esprime nel linguag- 
gio più o meno intuitivo della teoria degli insiemi; il formalismo linguistico della 
teoria degli insiemi precisa le rappresentazioni intuitive e, a loro volta, le co- 
struzioni utili che vengono selezionate all’interno di questo formalismo sono 
definite da considerazioni intuitive. Per questo le ulteriori considerazioni sulle 
strutture si condurranno in termini di teoria intuitiva degli insiemi, sottinten- 
dendo una loro possibile formalizzazione. 


2.6. Strutture fondamentali secondo-Bourbaki: un esempio. 


La seguente esposizione è da considerarsi preliminare: per ulteriori dettagli 
si veda il $ 3, mentre per i concetti fondamentali qui utilizzati, ma non definiti, 
si vedano gli articoli « Applicazioni» e «Insieme » in questa stessa Enciclopedia. 


Si segue qui il Fascicule de résultats di Bourbaki [1939]. 


Si ricordi che se è data una famiglia di insiemi ®, è possibile costruire nuovi 
insiemi a partire da essa, considerando l’insieme delle parti degli elementi della 
famiglia e il prodotto diretto di elementi della famiglia in un ordine definito. 
Aggiungendo questi alla famiglia originale si possono ripetere le stesse opera- 
zioni e cosi via. Si indichi con &() la famiglia massimale ottenuta in tal modo 
e la si chiami scala d’insiemi di base 9. Ad esempio partendo da una base di 
tre insiemi B= (M, N, P), al primo gradino della scala si ottiene la famiglia di 
quindici insiemi: M, N, P; P(M), P(N), P(P); Mx M, Nx N, PxP; Mx N, 
M x P,Nx P; Nx M, Px M, Px N. Ogni elemento R della scala 8(3) è as- 
segnato quando si indica la successione di operazioni fondamentali che occorre 
applicare agli elementi della base ® per ottenere R; questa successione si dice 
schema di costruzione. 
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L'osservazione fondamentale di Bourbaki consiste nel fatto che gli usuali 
concetti matematici, come gruppo, insieme ordinato, spazio topologico, ecc. pos- 
sono essere definiti dai seguenti dati: a) una base B; 8) un elemento o di uno 
degli insiemi N della scala 8(3); c) alcune condizioni su questo elemento c: 
gli «assiomi». Queste condizioni possono essere espresse da una formula nel 
linguaggio formale della teoria degli insiemi, come anche dall’indicazione di 
quell'insieme di é(9) di cui o è un elemento. In questa formula rientrano gli 
elementi della scala &(B). 

In una tale descrizione sono essenziali i seguenti oggetti: il termine che de- 
scrive N e la formula che descrive le condizioni su c; gli elementi della base pos- 
sono essere considerati indeterminati, o variabili; questo termine e la formula 
descrivono allora un certo tipo di struttura. L'assegnazione di una base con- 
creta 3 e di un elemento concreto o corrisponde alla scelta di una struttura 
concreta di dato tipo. 

Si illustra ora quanto detto sull’esempio della struttura «spazio topologico». 
Le corrispondenti formule e termini saranno descritti nel linguaggio esteso 
L, Set che comprende in particolare le operazioni P e x, utilizzando le con- 
suete abbreviazioni di scrittura (si veda il già citato articolo «Insieme»). La 
base è costituita da un insieme M, l’insieme dei punti del futuro spazio topo- 
logico. La topologia è data da un insieme di sottoinsiemi aperti di /M, e cioè 
da un sottoinsieme TCP (M) che si può anche considerare come elemento 
ceP(P(M)). L'insieme N=9P(P(M)) appartiene alla scala &({M}), mentre o 
fornisce la struttura richiesta. Per descrivere la formula degli «assiomi di spazio 
topologico» si scrivano ora nel linguaggio L, Set le consuete componenti verbali: 


a) M e il sottoinsieme vuoto di M sono aperti: P,: GeT AMET; 
b) l’intersezione di ciascuna coppia di elementi di T° appartiene a 7: 
P.:VaxVy(xeTAyeT=>xNyeT); 
c) l'unione di una famiglia qualsiasi di elementi di 7° appartiene a T: 
Py:Va(xeP(T)>U yeT). 
yer 
La formula © : P,AP,AP, è l'assioma di spazio topologico. La coppia (0, as- 
sioma È) definisce il tipo di struttura «spazio topologico». 

‘Tutte le proposizioni derivabili in un linguaggio del tipo L, Set dai suoi 
assiomi e dall’assioma © appartengono alla teoria degli spazi topologici. Ag- 
giungendo «nuovi assiomi», vale a dire rafforzando È, si ottiene la teoria di una 
struttura più ricca. Ad esempio, si può aggiungere ai consueti assiomi di topo- 
logia l'assioma di separazione secondo Hausdorff, pervenendo alla teoria degli 
spazi separati. Oppure è possibile riunire in un insieme due strutture, ad esem- 
pio di spazio topologico e di gruppo richiedendo che siano compatibili, nel sen- 
so che le operazioni di gruppo siano funzioni continue. Si perviene cosi alla teo- 
ria dei gruppi topologici. 

Può avvenire che gli assiomi di una data struttura siano contraddittori; in 
accordo con Gòdel ciò equivale al fatto che sia vuota la parte 7, definita dagli 
assiomi di qualche insieme della scala &(®) a cui deve appartenere l'elemento 
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o che definisce la struttura (per lo meno se la teoria è formalizzata in un lin- 
guaggio del prim'ordine). Oppure può avvenire che gli assiomi di una data 
struttura la determinino univocamente a meno di isomorfismi (si veda più avan- 
ti). Da un punto di vista logico questa possibilità è considerevolmente più sot- 
tile; presuppone una gerarchia di almeno due linguaggi in quanto, secondo 
Skolem, la teoria del prim'ordine dei numeri naturali, ad esempio, se non è con- 
traddittoria, ammette infiniti modelli non isomorfi, e la scelta di uno di essi può 
essere effettuata soltanto per mezzo di un linguaggio più potente (cfr. ancora 
l'articolo « Insieme»). Senza entrare nel merito di questi problemi va osservato 
che è possibile attribuire un significato all’affermazione che i numeri interi, i 
numeri reali, la geometria euclidea classica, ecc. sono univocamente determinati 
dai loro assiomi. È questo un aspetto caratteristico della matematica classica. 

Infine la maggior parte delle strutture fondamentali di Bourbaki ammette 
più realizzazioni non isomorfe, perfino nel senso classico della parola: sono tali 
i gruppi, gli spazi topologici, le varietà differenziabili, ecc. Secondo Bourbaki, 
lo studio di teorie a più realizzazioni è l'aspetto più sorprendente che distingue 
la matematica contemporanea da quella classica. 


2.7. Strutture «generative ». 


Bourbaki sottolinea che il metodo assiomatico, nel quale l’unità centrale del- 
l’analisi è il concetto di struttura, si presenta come un metodo creativo, in quan- 
to permette di osservare analogie esistenti fra teorie a prima vista relative a og- 
getti diversi. Negli Eléments de mathématique la teoria di ciascuna struttura fon- 
damentale viene sviluppata quanto più è possibile e in maniera conseguente. Il 
matematico che riconosce nel proprio oggetto di ricerca delle strutture fonda- 
mentali può allora consultare un arsenale già pronto d’informazioni e di metodi 
di lavoro su queste. Fra tutte le strutture si distinguono tre gruppi maggiori 
di «strutture generatrici», tali che le altre si possano rappresentare come loro 
derivate. Ne fanno parte: 

a) Le strutture algebriche. Sono strutture connesse con varie leggi di com- 
posizione, ossia applicazioni Xx Y-+Z, come i gruppi, le algebre di Lie, gli 
anelli, i campi, ecc. La cristallizzazione delle rappresentazioni relative alle strut- 
ture algebriche è legata al graduale riconoscimento degli aspetti comuni ai di- 
versi processi di calcolo. Fra le pit note, le quattro operazioni dell’aritmetica 
elementare: somma, differenza, prodotto e divisione. Storicamente il successivo 
ampliamento del concetto di numero — dai naturali, interi, reali ai complessi 
calcolati in modulo, ecc. — si è accompagnato alla scoperta che la forma dell’ap- 
parato di calcolo (operazioni fondamentali e identità) rimane immutata sebbene 
cambino gli oggetti sui quali si conduce il calcolo. Calcoli con matrici e sostitu- 
zioni rivelarono la conservazione di alcune proprietà delle operazioni analoghe 
al prodotto (associatività, esistenza di unità) e la mancanza di altre (commuta- 
tività). L’analisi del grande apparato algebrico di tutta la matematica ha condot- 
to gradualmente alla nascita di astrazioni matematiche di due tipi, che sono sta- 
te codificate nel xx secolo: il concetto di linguaggio formale e il concetto di leg- 
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ge di composizione astratta su una famiglia di insiemi. Nella matematica attuale 
entrambi questi aspetti dell’astrazione sono talvolta inseparabilmente mescolati. 
Un’accurata analisi dei fondamenti mostra la loro complementarità, sebbene sia 
possibile ridurre i linguaggi a insiemi con leggi di composizione e gli insiemi 
con leggi di composizione a modelli di un linguaggio. Bourbaki naturalmente 
dà la preferenza al punto di vista insiemistico. 

La più semplice legge di composizione è un’applicazione f : Ex E+ E che 
associa a ogni coppia di elementi (4,5) di un insieme E un terzo elemento 
f(a,b)e E. Le leggi associative, quelle per cui (ab)c=a(bc), assumono usual- 
mente il nome di «prodotti», dove si è notato f(a,b)= ab. 

A volte un motivo più profondo di importanza della proprietà associativa 
consiste nel fatto che è associativa la composizione insiemistica di applicazioni, 
cioè il prodotto di morfismi nella categoria degli insiemi. Uno dei più potenti 
approcci allo studio delle leggi di composizione non associative sta nella loro ri- 
duzione a leggi associative: se ad un elemento ae E si associa l’applicazione 
ad,: E-+E,ad,(b)= ab, allora la composizione di applicazioni ad, sarà associativa. 

Una legge di composizione Ex E+ E, relativa a elementi di uno stesso in- 
sieme, si dice interna. Sono utili e s'incontrano spesso anche leggi di composi- 
zione esterne, ad esempio applicazioni Fx E+ E o anche Fx E+G. Si dice che 
gli elementi di F agiscono come operatori sull'insieme E. Leggi di operatori 
entrano nella definizione di strutture fondamentali quali moduli su un anello, 
spazi vettoriali su un campo, ece. Il caso in cui l’insieme degli operatori è un 
gruppo e la composizione in F corrisponde alla composizione delle applicazioni 
è il modello matematico fondamentale del concetto di simmetria (si veda l’o- 
monimo articolo in questa stessa Enciclopedia). 

Leggi di composizione lineari, come moduli e spazi lineari, costituiscono i 
modelli fondamentali delle idee di teoria della misura e del principio di «linea- 
rità dei piccoli incrementi» che, insieme alle concezioni topologiche, sono alla 
base dell’analisi matematica, ossia del calcolo differenziale e integrale. Leggi di 
composizione che definiscono strutture del tipo dei campi e degli anelli rien- 
trano nella teoria dei corpi di numeri reali e complessi, degli anelli di operatori 
lineari, nella teoria delle equazioni algebriche (anelli di polinomi e loro esten- 
sioni), ecc. 

5) Le strutture d’ordine costituiscono la successiva classe di strutture gene- 
ratrici secondo Bourbaki. In matematica gli esempi più importanti sono forniti 
naturalmente dai numeri naturali, dai numeri reali e da qualsiasi insieme di nu- 
meri reali. L’archetipo psicologico delle strutture d’ordine è l’idea di tempo, 
reso discreto oppure continuo. Il motivo fondamentale per comprendere le strut- 
ture d’ordine fra quelle generatrici è la scoperta dei numeri ordinali e del me- 
todo di induzione transfinita da parte di Georg Cantor. Bourbaki preferisce uti- 
lizzare l’induzione transfinita nella forma del lemma di Zorn, la cui formulazio- 
ne e dimostrazione fanno a meno dell’introduzione dei numeri ordinali. Si può 
discutere dei vantaggi e dei difetti di questa opzione. L'elegante costruzione de- 
gli insiemi totalmente ordinati, realizzata dalla teoria di Cantor, è di fatto quasi 
sempre inessenziale per l’induzione transfinita. D'altro lato l’idea di « computa- 
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zione successiva» degli elementi di un insieme qualsiasi di solito dà maggior ri- 
lievo sia all’essenza delle applicazioni sia ai loro centri nevralgici, dal punto di 
vista dei critici dell’infinito attuale. l 

Le strutture d’ordine assumono un significato sempre maggiore nei tenta- 
tivi di applicazione della matematica fuori dalla fisica, cioè in biologia e in so- 
ciologia. La concezione fisica di «misura numerica» diventa spesso un letto di 
Procuste sul quale si dispongono male i massicci dati sociometrici 0 dello stesso 
genere. Spesso bastano solo valutazioni ordinali, e non è nemmeno detto che 
quest'ordine sia sempre totale. L'assegnazione di un numero agli elementi di 
una successione è allora in larga misura arbitraria e la sua elaborazione median- 
te formule può portare ad artifici metodologici (cfr. del resto il già citato arti- 
colo «Numero», in particolare il $ 7). l 

c) Le strutture topologiche costituiscono infine l’ultima classe di strutture 
generative. Esse sono legate all’archetipo psicologico della «vicinanza», le cui 
radici riposano nei meccanismi biologici dell’organizzazione dello spazio percet- 
tivo intorno a un centro, coincidente col corpo dell'osservatore. La valutazione 
della vicinanza del cibo, del ricovero, del nemico è infatti vitale per l’esistenza 
individuale e la continuazione della specie. To . 

Con lo sviluppo della pratica produttiva le strutture di vicinanza si concre- 
tizzano in procedure di calcolo approssimato. Poiché i risultati della misura si 
esprimono con numeri, la topologia nasce prima di tutto come topologia dei nu- 
meri reali. Avvicinandosi a quest'idea, la costruzione contemporanea, cioè il con- 
cetto di spazio metrico, dà un insieme dotato di una funzione biargomentale det- 
ta « distanza» con proprietà che generalizzano quelle usuali della distanza nello 
spazio tridimensionale. Questa costruzione è eccezionalmente utile. Se ne 0s- 
servino le principali diramazioni verso le varie linee di sviluppo della topologia. 

Conservando la struttura euclidea infinitesimale e la dimensione finita si per- 
viene alle varietà riemanniane. Separando poi il meccanismo algebrico del pro- 
dotto scalare e rinunziando al fatto che esso sia una forma definita positiva, si 
perviene alle varietà pseudo-riemanniane, in particolare ai modelli contempora- 
nei dello spazio-tempo. Conservando soltanto la struttura lineare e la disugua- 
glianza triangolare, ma rinunziando alla dimensione finita, si perviene alle idee 
dell’analisi funzionale. Tuttavia qui non si è ancora rinunziato ar numeri reali. 

Più tardi nacque la concezione di intorno e d'insieme aperto, cioè di struttu- 
ra topologica nel suo aspetto moderno. Gli assiomi di spazio topologico secon- 
do Hausdorff sono una prosecuzione del «linguaggio e-ò » dell’analisi classica. 

Altri aspetti della topologia sono legati al problema della descrizione discreta 
delle forme geometriche, per mezzo di invarianti combinatori dei ricoprimenti o 
dei complessi simpliciali, di classi d’omotopia delle applicazioni, di singolarità, ecc. 


2.8. L’«architettura delle matematiche». 


Il tipo generale di oggetto matematico, secondo Bourbaki, è un insieme 
astratto dotato di struttura. L’architettura della matematica è determinata dalla 
gerarchia, dal confronto, dal concatenamento di strutture, a partire da quelle 


Strutture matematiche 1780 


generatrici che formano modelli sempre più complessi; la specializzazione a 
esempi concreti, eventualmente numerici, è collegata al caso generale, che com- 
prende questi esempi in un contesto ampio talvolta fino all’inverosimile. Ciò è 
evidente in maniera particolarmente chiara nell'esempio della moderna teoria 
dei numeri. 

È lecito affermare che i principî di Bourbaki risultano essenziali non solo 
perché gran parte della letteratura matematica degli ultimi decenni porta netto 
il marchio della loro influenza, ma anche perché nello sviluppo delle scienze na- 
turali si manifestano tendenze analoghe. Il linguaggio della fisica teorica, con 
la sua costante tendenza all’invarianza (o alla «covarianza») del formalismo, che 
riflette l'indipendenza della descrizione dall’osservatore e da scelte particolari 
di unità, di sistemi di riferimento, ecc., soprattutto dopo l’unione dello spazio 
col tempo in un unico continuo infinito, condusse a considerare le stesse strut- 
ture dell’analisi interna dei matematici. Le ricerche di Piaget e della sua scuola 
sulla psicologia della percezione infantile hanno rivelato la presenza di meccani- 
smi biologici, in un certo senso soggiacenti a «strutture generatrici ». Schemati- 
camente, un'analisi sottile, storicamente realizzata molto tardi, al nuovo livello 
riconduce a concezioni prematematiche del tipo « più/meno», «vicino/lontano», 
la cui essenza vitale, non razionalizzata, appartiene al periodo iniziale della vita. 


2.9. Due cambiamenti di punto di vista. 


Ciò nonostante, qualunque particolarità nella formulazione concreta dei 
principî di Bourbaki può essere storicamente superata. Vanno sottolineati due 
cambiamenti di punto di vista, che si sono prodotti dal tempo in cui nacque il 
progetto degli E/éments. Il primo è legato al fatto che Bourbaki sottovalutò le 
idee di algoritmo, costruibilità, programma. Non c’è dubbio che oggi il con- 
cetto di algoritmo, in una delle sue formulazioni moderne, debba essere colle- 
gato a numerose strutture matematiche fondamentali e trovare un posto corri- 
spondente negli Eléments. Il fatto che ciò non sia avvenuto si spiega con moti- 
vazioni storiche e psicologiche. Come si è già ricordato, all’inizio del suo gigan- 
tesco lavoro Nicolas Bourbaki era notevolmente giovane. Nello stesso tempo ve- 
niva creata la teoria delle funzioni ricorsive; evidentemente non era del tutto 
chiaro in quale misura questa teoria appartenesse alla matematica e in quale alla 
metamatematica, con cui i rapporti dei matematici attivi sono sempre stati tut- 
t'altro che univoci. Ritenendo necessario etichettare le convenzioni del forma- 
lismo nella grandiosa Théorie des ensembles [1954], Bourbaki formulò di fatto il 
proprio linguaggio di lavoro nel breve Fascicule de résultats [1939] e in seguito 
si disinteressò di queste convenzioni. Per questo una parte essenziale di genuini 
risultati matematici della metamatematica fu trascurata, inclusa una delle strut- 
ture fondamentali. 

Il secondo cambiamento di cui sarebbe in linea di principio possibile tener 
conto in successive edizioni degli E/éments è più recente e legato alla compren- 
sione del ruolo delle categorie (cfr. ancora « Applicazioni»). Va ricordato che il 
punto di vista categoriale applicato alle strutture di un dato tipo, ad esempio 
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agli insiemi ordinati, ai gruppi o agli spazi topologici, consiste in questo: prima 
di tutto si considera la classe di tutte le strutture del dato tipo, i cui elementi 
sono detti oggetti della categoria. Per rendere quanto è dovuto alle difficoltà 
insiemistiche, occorre dare senso alla parola ‘tutte’ nella frase precedente, con- 
venendo ad esempio di lavorare in un universo insiemistico fissato, altrimenti 
ci si trova pericolosamente vicini al paradosso di Russell (cfr. ancora l’articolo 
«Insieme »). Occorre quindi definire chiaramente i morfismi della categoria. Nei 
casi più semplici la scelta della classe dei morfismi è evidente e univoca: nella 
categoria dei gruppi sono le applicazioni insiemistiche compatibili con le leggi 
di gruppo, vale a dire gli omomorfismi di gruppo. Tuttavia questa scelta spesso 
non si presenta né evidente, né univoca. Fra gli oggetti della categoria degli in- 
siemi ordinati può risultare ragionevole considerare applicazioni strettamente 
crescenti, oppure crescenti ma non strettamente. Fra spazi topologici si posso- 
no considerare come morfismi le arbitrarie applicazioni continue, ma spesso è 
produttivo considerare come tali le classi di omotopia di applicazioni continue. 
Il concetto di morfismo fra oggetti con una data struttura non deriva cosi univo- 
camente dalla definizione della struttura, ma dev'essere assegnato dall'esterno. 

La scelta della definizione dei morfismi è spesso dettata dalla necessità di 
adattarla a qualche tipo di costruzione naturale, interessante fra gli oggetti con 
la data struttura. Ad esempio nella teoria delle varietà algebriche il punto di vi- 
sta classico era essenzialmente «birazionale», in particolare si consideravano 
morfismi delle applicazioni che potevano avere singolarità su sottovarietà di di- 
mensione minore. Il cambiamento di accento che si verificò con l’introduzioné 
formale della categoria delle varietà algebriche solo con applicazioni regolari in 
qualità di morfismi si consolidò definitivamente quando fu chiaro che la costru- 
zione delle coomologie dei fasci coerenti ammette buone proprietà funtoriali 
proprio per questa ristretta classe di morfismi. 

Costruzioni naturali fra oggetti di categorie che si comportavano bene ri- 
spetto ai morfismi furono in seguito dette funtori e il punto di vista per il quale 
le categorie e i funtori appartengono ai concetti matematici fondamentali, e le 
costruzioni fondamentali devono essere funtoriali, si diffonde sempre pit. Il ri- 
conoscimento di ciò è legato ai successi della topologia e in seguito della geo- 
metria algebrica: il fiorire rigoglioso di queste scienze, cominciato negli anni ‘50, 
ha prodotto una grande influenza sul contenuto e sulla forma della matematica 
contemporanea. Lo sviluppo di questo periodo è ben documentato nei lavori 
del seminario Bourbaki, mentre nuove redazioni degli Eléments, con i naturali 
aggiornamenti temporali, riflettono tale cambiamento di punto di vista. Per sua 
propria essenza esso si accorda perfettamente alle concezioni fondamentali di 
Bourbaki: la matematica delle categorie rimane insiemistica e la generalità delle 
considerazioni, che suggerisce analogie fra teorie, è raggiunta in misura ancora 
maggiore di quando ci si limita alle strutture. Inoltre, come si è tentato di di- 
mostrare negli articoli « Dualità» e «Applicazioni» di questa Enciclopedia, i pun- 
ti di vista categoriale e strutturale si trovano in un rapporto di complementa- 
rità reciproca abbastanza complesso: essi non si escludono, ma si arricchiscono 
l'un l’altro. 


Strutture matematiche 782 


2.10. Ancora sul punto di vista categoriale. 


Negli ultimi anni il punto di vista categoriale ha cominciato a esercitare una 
profonda influenza non solo sulla costruzione della matematica complessiva- 
mente, ma anche sulla concezione dei suoi fondamenti. In una serie di lavori 
Lawvere e la sua scuola hanno sintetizzato le idee di alcune tendenze sorte in 
maniera completamente isolata: dalla logica, in particolare intuizionistica, dalla 
teoria delle topologie astratte di Grothendieck, dalla teoria delle probabilità e, 
in una certa misura, dalla fisica teorica. Vale la pena di descrivere brevemente 
il senso generale di questi lavori. 

Nella teoria delle categorie esiste la costruzione generale di « relativizzazio- 
ne»: se sono dati una categoria C ed un suo oggetto B, si può considerare una 
nuova categoria C'g «di oggetti relativi», o «oggetti su B». I suoi oggetti sono 
i morfismi X-B, dove X è un oggetto variabile di C, e i morfismi di X-+B 
in Y+B sono costituiti dai morfismi X- Y che commutano con le applicazioni 
«strutturali» di X e di Y su B. Se Ens è la categoria degli insiemi, è comodo 
rappresentare gli oggetti della categoria Ensg come famiglie di insiemi X,= 
=f(b) parametrizzate dai punti de B. In questo senso Ensg arricchisce l’u- 
suale categoria degli insiemi. In tal modo si possono relativizzare tutte le rela- 
zioni e le costruzioni di teoria degli insiemi: ad esempio la relazione di inclu- 
sione Xc Y in Ens, che da un punto di vista logico può essere solo verificata 
oppure non verificata, corrisponde ora a un più sottile valore di verità: il sot- 
toinsieme {be B| X,c Y;} CB come elemento dell’algebra di Boole dei sottoin- 
siemi di B. Sono possibili numerose varianti di questa interpretazione. Ad esem- 
pio nella categoria degli «spazi topologici su B» è naturale talvolta considerare 
i morfismi X-+B non come famiglia di fibre, ma come fascio delle sezioni locali 
di questo morfismo su tutti i possibili insiemi aperti di B. A sua volta questo 
fascio può essere dotato della struttura di fascio di gruppi, o di spazi topologici, 
ecc. Dal punto di vista logico queste costruzioni costituiscono un potente me- 
todo per la formazione di modelli non standard di teorie classiche, nelle quali 
la motivazione «non standard» è intuitivamente ed eccezionalmente chiara: l’in- 
clusione di un insieme di parametri variabili della teoria B. L’interpretazione 
di B come parametro temporale è possibile nello spirito dell’intuizionismo, con 
cui si realizza l’inclusione inaspettata del formalismo intuizionista nella mate- 
matica classica. 

Si riassumerà ora la parte non formale delle considerazioni qui esposte. La 
dialettica dell’opposizione struttura/evoluzione riflette la generale opposizione 
scientifica essere/divenire. Il successo della teoria degli insiemi come linguaggio 
universale della matematica e della concezione delle strutture matematiche come 
realizzazione concreta di questo linguaggio ha segnato uno spostamento d’ac- 
cento sui primi elementi di queste opposizioni. Le concezioni relative sempre 
più diffuse nei fondamenti, gli assiomi categoriali, ecc. segnano il movimento 
inverso, quando « divenire» e «incompiuto » sono considerati primitivi. Le pa- 
role di Lawvere esprimono chiaramente questo cambiamento di valori: «Ogni 
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nozione di costanza è relativa, essendo derivata percettivamente o concettual- 
mente come caso limite della variazione, e l’indiscusso valore di queste nozioni 
nello spiegare la variazione è sempre limitato da questa origine. Ciò è vero in 
particolare per la nozione di insieme costante e spiega cosi perché tanta parte 
di teoria intuitiva degli insiemi si trasporti in qualche forma nella teoria degli 
insiemi variabili» [1973, p. 136]. 


3. Le strutture secondo Bourbaki: descrizione formale. 


In questo paragrafo si daranno le definizioni fondamentali e le costruzioni 
legate al concetto di struttura secondo Bourbaki. Negli Eléments de mathéma- 
tique queste definizioni sono esposte soltanto al livello del linguaggio formale 
della teoria degli insiemi. Per semplificare il passaggio al punto di vista delle 
categorie e dei topoi, descritto più avanti, si darà un’interpretazione parallela 
utilizzando il concetto di universo. 


3.1. Il linguaggio formale. 


Si consideri fissato un linguaggio formale della teoria degli insiemi, del tipo 
descritto nel $ 2 dell’articolo «Insieme» di questa stessa Enciclopedia: L, Set. 
Per economia di scrittura, e per avvicinarla all’usuale standard matematico, si 
lavorerà su una variante allargata del linguaggio, nel quale si abbiano termini 
del tipo P (x) (l'insieme delle parti dell’insieme x); xx y (prodotto diretto degli 
insiemi x e y), {y | P(9,y1,.-19,)} (insieme di tutti gl’insiemi y che verificano la 
condizione P, formulata per mezzo di insiemi « parametrici » ausiliari y1, ...,7,), ecc. 


3.2. L'universo. 


Si fissi un insieme U (i cui elementi sono pure insiemi) soddisfacente le se- 
guenti condizioni: 


a) se xeU e yex, allora yeU; 

5) se x,yeU, allora {x,y}eU; 

c) se xe BU, allora P(x)e U; 

d) se (x,) è una famiglia di elementi di U, indiciata dall'insieme Ze%U, al- 


lora) a, € UL 


ael 


Un insieme U di questo tipo sarà detto universo e l’interpretazione stan- 
dard del linguaggio L, Set sarà considerata in U. Si consideri l'universo U co- 
me modello intuitivo della teoria degli insiemi. (Per le costruzioni e una de- 
scrizione più dettagliata degli universi cfr. ancora «Insieme», $ 4). Utilizzando 
una variante intuitiva degli assiomi di Zermelo-Fraenkel (cfr. l'articolo « Assio- 
ma/postulato ») si può mostrare che qualunque universo U è chiuso rispetto alle 
seguenti costruzioni: passaggio alle parti di un insieme di U, quoziente rispet- 
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to a una relazione di equivalenza, formazione delle n-ple ordinate, costruzione 
di somma e prodotto di famiglie di insiemi di U indiciati da elementi di U, 
ecc. Inoltre ogni applicazione x-+y dove x,yeMU (0 più precisamente il suo 
grafico, si veda l’articolo « Applicazioni») appartiene a U. Considerando queste 
applicazioni come morfismi, con l’usuale composizione insiemistica, è possibile 
trasformare U in una categoria (cfr. ancora « Applicazioni»). 


3.3. L’universo come categoria. 


La categoria UU è dotata, oltre che degli usuali funtori id: U+%U e Hom, 
del funtore prodotto diretto e di una particolare applicazione sugli oggetti 
P:U+%U (insieme delle parti). Si può trasformare in un funtore in due modi. 
All’applicazione f: X+Y si può associare l'applicazione f*: P(Y)+9P(X) che 
a ogni parte di Y associa la sua controimmagine in X; in tal modo 9 diventa 
un funtore controvariante. Si può anche associare a ogni parte di X la sua im- 
magine in Y: f.:9P(X)-®(Y). In tal modo 9 diventa un funtore covariante. 
Se f è un isomorfismo (vale a dire un’applicazione biunivoca di insiemi), allora 
f* e fs sono isomorfismi inversi P(X) & P(Y). 

Un ruolo importante è svolto anche dall’applicazione f;: P(X)+9P(Y) che 
associa a ogni parte ZC X il sottoinsieme f.(Z) C Y costituito da quegli elemen- 
ti ye Y tali che f-1(y) sia interamente contenuto in Z. 


3.4. Schemi di costruzione nell’universo. 


Dai funtori id, x e 9 (nell’estensione controvariante o covariante) è pos- 
sibile, per mezzo della composizione, formare nuovi funtori, ad esempio: 
Polidxidx P):UxUxUU:(x,y,2)>P(xxyx P(2)). Ogni funtore S che 
si può ottenere in questo modo si dice schema di costruzione di scala. Sosti- 
tuendo al posto degli argomenti di uno schema di costruzione qualche insieme 
di U, si ottiene il risultato dell’applicazione di questo schema di costruzione ai 
dati insiemi. Sia B un insieme di elementi di U. Il più piccolo sottoinsieme 
contenente B e chiuso rispetto alle applicazioni ai suoi elementi di tutti gli sche- 
mi di costruzione si dice scala di insiemi di base B. Più precisamente questa 
definizione si può formulare in maniera comoda nei termini di un linguaggio 
formale. 


3.5. Schemi di costruzione e linguaggio formale. 


Uno schema di costruzione a m-elementi è assegnato da una successione di 
coppie di numeri naturali (4,, d;), ..., (42m) soddisfacenti le seguenti condi- 
zioni: a) se b;=o0 allora 1<a;<î—1; b) se a; #0 e db; #0 allora 1<4G;<i-1€ 
1<b;<î—1. Un simile schema di costruzione si applica induttivamente a una 
successione di n termini È,, ..., E, del linguaggio, dove n= maxb; (rispetto alle 
coppie (0, b;)) e fornisce una successione A, ..., 4, di termini di questa teoria. 
Precisamente, se a;=0 allora A4;=£),; se d;=0 allora A;= g(E,,); se 4760 e 
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b;#0 allora A;= Ag,jX A, L'ultimo termine 4,, è il risultato dell’applicazione 
dello schema S ai termini di base £,, ..., E, L’interpretazione del linguaggio 
formale nell'universo U permette di passare da una definizione all’altra. 

In altri termini, assegnare uno schema di costruzione non consiste soltanto 
nell’assegnare un funtore di tipo P(P(X) x P(Y)), ma anche nell’assegnare una 
successione per la sua costruzione per mezzo di passi elementari. L’inclusione 
di questa successione nella definizione è comoda per dare costruzioni induttive 
e dimostrazioni; pertanto uno stesso funtore può essere descritto da schemi di- 
versi. Ad esempio conducono a P(P(X)x P(Y)) gli schemi (0,1), (0,2), (1,0), 
(3,0), (2,0), (4,5) oppure (0,2), (0,1), (1,0), (2,0), (4,0), (5,3). 


3.6. Relazioni trasportabili. 


Siano x,, ..., Xn) S1; +++» Sp lettere dell’alfabeto di un linguaggio, A, ..., Am 
termini non contenenti le lettere x; e s; (r<i<n, 1<j<p). Si scelgano degli 
schemi di costruzione a (1+m) termini $i, ..., S, (nella variante linguistica) e 
si consideri la relazione (formula) Tx, ..., Xn) Sh +43 Sp) : SE SI(X Cm A 
ve Am) A NSpE Sp(%1) + %m Ax + Am). Una simile relazione si dice tipifi- 
cazione delle lettere s., ..., s,, Se è assegnata un’interpretazione del linguaggio 
nell’universo U, i valori di x; sono detti insiemi fondamentali elementari e quelli 
di A; insiemi ausiliari elementari. 

Sia R(x1, ..., Xn, 51) ++» Sp) una relazione (formula) comprendente alcune fra 
le lettere x;, 5; e, eventualmente, altre lettere. Si scelgano due interpretazioni 
del linguaggio nelle quali 4, ..., Am assumano gli stessi valori (che si indiche- 
ranno ancora con 4;), e x; rispettivamente i valori x{ e x. Si supponga inoltre 
che siano date delle biiezioni f; : x{ +x{". Per la prima interpretazione sia verifi- 
cata la relazione di tipificazione T'(x1, ..., %h; 51)», 5p). Si ponga sj" = immagine 
di sj nelle applicazioni f; : xj>x;, id: A,> 4 estese a Si, ..., S, con la defini- 
zione covariante di 9. Allora sarà verificata anche la relazione di tipificazione 
T(a1, -, %1 543 +» 59). Se, sotto queste condizioni, le relazioni R(x1, ..., % 
St +» Sp) € R(87, +, XS; ++ 55) sono equivalenti, allora si dice che R è una 
relazione trasportabile rispetto alla tipificazione 7. 

L’equivalenza di relazioni si può qui intendere in un senso della teoria for- 
male degli insiemi anche più forte di quello iniziale. Ad esempio, per la tipifica- 
zione di s,€x,\sg€x, la relazione s1=s, è trasportabile, mientre la relazione 
x,= x, non lo è. 


3-7. Tipi di struttura. 


Un tipo di struttura è descritto da un testo X nel linguaggio della teoria degli 
insiemi, il quale è costituito dai seguenti sottotesti: 


a) una collezione non vuota di lettere x,, ..., x,, s appartenenti all’alfabeto 
del linguaggio, fra le quali non vi siano simboli di costante; queste lettere 
devono essere a due a due diverse; x,, ..., x, denotano insiemi elementari 


della struttura; 
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b) una collezione di termini del linguaggio A,, ..., A, non contenenti le let- 
tere x;, s. Questa collezione può essere vuota; i termini denotano insiemi 
ausiliari della struttura; 


c) una tipificazione T(,, ..., n, s) della forma se S(x,, ..., %n An 1 Am) 
dove S è uno schema di costruzione a (2+m) termini; 
d) una relazione R(x1, ..., xy) $) trasportabile rispetto alla tipificazione 7. 


La teoria formale del tipo di struttura X è la collezione di formule logica- 
mente derivate dagli assiomi della teoria degli insiemi e dall’assioma ulteriore 
TAR. 

Sia data un’interpretazione della teoria formale del tipo di struttura X nel- 
l'universo intuitivo degli insiemi (o in una teoria formale più forte). X,, ..., 
X, S siano i valori delle lettere x,, ..., x, s in questa interpretazione (cioè in- 
siemi o costanti di una teoria più forte) e siano Ai, ..., 4f, i valori dei termini 
A; +, Am. Si dirà allora che S fornisce una struttura di tipo X alla famiglia di 
insiemi elementari X,, ..., X, e di insiemi ausiliari 4{, ..., Aly. La condizione 7° 
è una caratterizzazione tipica del tipo di struttura, mentre la condizione R un 
assioma del tipo di struttura. 

Nel punto precedente è stata definita la tipificazione di una famiglia finita 
di lettere sy, ..., sp; nella descrizione del tipo di struttura è sempre possibile 
limitarsi alla tipificazione di una sola lettera, pur di sostituire la famiglia di 
schemi di costruzione Si, ..., S, con lo schema di costruzione S1X...X.S, € 
51) + Sp CON $=(54, ..., Sp). Analogamente una famiglia finita di assiomi R., ..., 
R, può essere sostituita dall’unico assioma R, A... \R,. In una descrizione non 
formale del tipo di struttura, queste condizioni, come molte altre, non sono ne- 
cessariamente rispettate. 

Nelle note introduttive si è indicata la descrizione del tipo di struttura «spa- 
zio topologico». Per chiarire la posizione generale si aggiungono ora due altre 
descrizioni di tipi di struttura, che fanno parte di quelle generatrici. 


3.8. Insieme ordinato. 


Si ha qui un insieme elementare x e nessun insieme ausiliario. Il grafico 
della relazione di ordine è definito dalla tipificazione se P (xxx). Per formula- 
re gli assiomi occorre utilizzare due operazioni fra corrispondenze: la composi- 
zione e l’inversione. Una corrispondenza fra gli insiemi x, y è un sottoinsie- 
me uCxXy, cioè un elemento ueP(xxy). Sia ucaxy e vey X8; si ponga- 
no uov = proiezione su x X 3 del sottoinsieme (1x2) N (axv)CaxyxXz, e 
u-1= {Kb,a)|Ka,b)eu}cy xx. (Il lettore può scrivere queste formule nella più 
semplice variante del linguaggio L, Set). Dopo questi chiarimenti, l'assioma di 
insieme ordinato può essere scritto nella forma sos=s/AsNs=A,, dove 
A,cxxx è la diagonale: A,= {Ka,a)| aex}. Non è difficile verificare la tra- 
sportabilità di questa relazione. 
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3.9. Gruppo. 


Anche qui si ha un insieme elementare x e nessun insieme ausiliario, È 
comodo dare la tipificazione per una terna di elementi s=<e,m,i), dove 
eex,meP(xx xxx), ie P(x Xx) sono rispettivamente l’unità, il grafico della leg- 
ge di composizione (a,b) +ab e il grafico dell’applicazione di inversione 44 4-1. 
Gli usuali assiomi di gruppo, associatività, assiomi di unità e dell'elemento in- 
verso, si scrivono senza difficoltà nel linguaggio formale. La loro trasportabilità 
è oltremodo evidente. 


3.10. Strutture derivate. 


Partendo da alcuni tipi di struttura assegnati è possibile ottenerne di nuovi 
per mezzo di una serie di costruzioni spesso utilizzate. Ne fanno parte: 


a) unione di più strutture nello stesso sistema di insiemi fondamentali (grup- 
po topologico, spazio lineare metrico, ecc.); 

b) arricchimento della struttura con l'aggiunta di nuovi assiomi (insiemi to- 
talmente ordinati rispetto a quelli ordinati, gruppi di Lie rispetto ai grup- 
pi topologici, ecc.); 

c) processo inverso: impoverimento della struttura (fino a dimenticare tutto 
e lasciare soltanto la struttura insiemistica fondamentale). 


Una parte di questa procedura può essere descritta in maniera formale nella 
metateoria del linguaggio della teoria degli insiemi, come fa Bourbaki. Non ci 
si soffermerà su questo argomento. 


3.11. Il problema dei morfismi. 


Si consideri un tipo di struttura X. Per semplicità si supporrà di avere un 
unico insieme fondamentale e che la tipificazione sia data per un unico elemen- 
to della scala. Il concetto di morfismo di strutture di tipo 2 può essere asse- 
gnato per mezzo di un termine c(x, y, $,#) in cui le lettere sono a due a due di- 
verse e non costanti. Questo termine deve soddisfare le seguenti condizioni: 
a) dagli assiomi del tipo di struttura X per (x,5) e (y, 7) segue che il termine 
c(x, Y,5,t) è contenuto nell’insieme delle applicazioni di x in y; 5) nelle mede- 
sime ipotesi, se fec(x,y,5,7) e geo(y,z,t,u) allora gofeo(x,2,5,4); c) una 
bilezione f:x+y è un isomorfismo di strutture se e solo se feo(x,y, 5,7) e 
F€6(y,x,t,s). In questa scrittura vi sono alcune imprecisioni (abusi di lin-. 
guaggio!), ma non vale la pena essere più precisi. 

E ormai completamente chiaro che il concetto di morfismo non deve essere 
derivato da quello di struttura. In primo luogo i morfismi non sono univoca- 
mente definiti; in secondo luogo, non devono essere necessariamente delle ap- 
plicazioni degli insiemi fondamentali, e la loro composizione non deve neces- 
sariamente essere la composizione di applicazioni. L'esempio classico, che fra 
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l’altro non si allontana troppo dal modello originale, è la categoria degli spazi 
topologici in cui si assumono come morfismi le classi di equivalenza omotopica 
di applicazioni continue. Un altro esempio è la categoria degli insiemi (senza 
ulteriore struttura) quando si prendano come morfismi le corrispondenze, cioè 
arbitrarie relazioni binarie. In terzo luogo, dal punto di vista categoriale, si può 
ritenere che la definizione della struttura sia soltanto una costruzione interme- 
dia; quello che in realtà interessa è la categoria delle strutture di un dato tipo, 
ed allora è possibile che risulti più comodo assegnare la struttura come oggetto 
secondario, considerando principale una certa classe importante di morfismi. 
Ad esempio, è naturale introdurre la struttura di topologia di Zariski sugli og- 
getti della categoria delle varietà algebriche, su un campo algebricamente chiuso 
k, come la topologia meno fine in cui £ è topologizzato coi complementi degli 
insiemi finiti, e tutte le funzioni razionali sulle varietà sono continue al di fuori 
dell'insieme dei propri poli. In quarto luogo, ancora dal punto di vista catego- 
riale, un concetto come quello di equivalenza di diversi tipi di struttura (ad 
esempio la nozione di gruppo assegnata con diversi sistemi di assiomi) si defini- 
sce in maniera naturale per mezzo di un funtore, che sia un’equivalenza delle 
corrispondenti categorie. 

Esempi di questo tipo si potrebbero aumentare considerevolmente. Non si 
vuole tuttavia sostenere che si tratti di argomenti a favore di un totale rifiuto 
del concetto di struttura e di una sua sostituzione con quello di categoria. Negli 
articoli « Applicazioni» e «Dualità» di questa stessa Enciclopedia ci si è sforzati 
di mostrare che i concetti struttura/categoria hanno dei caratteri di complemen- 
tarità, e che attualmente il miglior approccio è quello di una considerazione pa- 
rallela dei due concetti, insieme alle loro complesse correlazioni e a parziali ridu- 
zioni, in casi particolari, dell’uno all’altro. In particolare, alcune classi di strut- 
ture generatrici, come quelle di gruppo, di insieme ordinato e di spazio topolo- 
gico, insieme ai loro morfismi naturali, continuano a mantenere un ruolo fon- 
damentale anche nelle costruzioni categoriali, che a loro volta permettono di 
considerarne le varianti più generalizzate. 


4. Topologie di Grothendieck e topot. 


4.1. Il programma di Grothendieck. 


In questo paragrafo viene descritto un sistema di concetti sorto originaria- 
mente in geometria algebrica. Tali concetti furono introdotti da Grothendieck 
allo scopo di definire degli invarianti topologici delle varietà algebriche su un 
campo astratto, ad esempio finito. Come ha affermato Weil alla fine degli anni 
40, la presenza di questi invarianti (più precisamente la teoria della coomologia 
con proprietà che permettano di dimostrare una formula per il numero di punti 
fissi di un’applicazione) permetterebbe di capire in profondità problemi di ca- 
rattere numerico (legati in particolare al numero di soluzioni di equazioni, mo- 
dulo un numero primo). Questo programma venne poi realizzato (cfr. l’artico- 
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lo «Geometria e topologia» in questa stessa Enciclopedia, al $ 6) e risultò inol- 
tre che il significato delle costruzioni del tutto generali di Grothendieck supe- 
rava i limiti del problema inizialmente posto e destava un notevole interesse, 
in particolare presso gli specialisti di logica matematica e dei fondamenti della 
matematica. Attualmente le topologie e i topoi di Grothendieck e di Lawvere 
possono essere considerati alternativi e complementari al linguaggio strutturale, 
e con estrema naturalezza permettono di includere nell’ambito della matematica 
generale i modelli non-standard di oggetti matematici, in primo luogo degli stes- 
si insiemi, come pure la logica intuizionista, ecc. Allo stesso tempo vengono alla 
luce i legami di queste costruzioni con temi da tempo assunti negli altri cam- 
pi della matematica. 

Per iniziare, si espongono ora le idee topologiche che conducono alla teoria 
di Grothendieck. 


4.2. Contesto topologico. 


Sia X uno spazio topologico, ad esempio una varietà differenziabile, com- 


N 
patta, -dimensionale, e si supponga dato un suo ricoprimento finito X=|_JU,. 
È noto che l’informazione essenziale sulla «forma» globale di X può essere ot- 
tenuta da una tabella finita che indichi quali intersezioni U;,,0...N Up ISSN, 
sono non-vuote; ciò è vero, almeno, quando tutte queste intersezioni sono bolle. 
Pit precisamente, si scelga un gruppo abeliano A e si associ a ogni numero in- 
tero &=o il gruppo delle cocatene di Cech C*(X,(U;); A), costituito dalle fa- 
miglie {4,,...,€41U,0-NU,#2)}, dove 4,,...i, è emisimmetrica rispetto a 
îo, «.-, îx- Si costruiscano gli omomorfismi d, : C+ C*+! per mezzo delle formu- 
le: (4 a)io sing FETI) Gigtjciza LOVE Î; denota che questo indice va tolto. 
Allora d;+1 o dy=0, ossia (C*, d) costituiscono un complesso. Si costruiscano 
i suoi gruppi di coomologia: H*(X,(U;); A)=Kerd,/Imd,-,. Nell'ipotesi che 
tutte le intersezioni non vuote U;,0...0U, siano bolle, i gruppi 77*(X,(U,); 
A) non dipendono dalla scelta del ricoprimento (U;) e sono invarianti topo- 
logici della varietà X. D'altro lato, come si è già osservato, sono completa- 
mente determinati da una collezione finita di dati combinatori sul ricoprimento, 
Senza assumere a priori condizioni addizionali sul ricoprimento, si possono defi- 
nire gli omomorfismi C*(X,(U,); A)-C*(X,(V;); 4) dove (V;) è un ricopri- 
mento più fine di (U;) e dimostrare che inducono degli omomorfismi dei gruppi 
di coomologia e quindi costruire il limite induttivo di questi gruppi di coomo- 
logia rispetto al sistema dei ricoprimenti e dei raffinamenti. Il risultato sarà lo 
stesso. 


4.3. Motivazioni dalla geometria algebrica. 


Nel tentativo di trasferire questa costruzione su varietà algebriche definite 
su un campo arbitrario, ci si imbatte anzitutto nella difficoltà che la topologia 
di Zariski è troppo grossolana. Più precisamente, se la varietà algebrica X è ir- 


26 


Strutture matematiche 790 


riducibile, allora ogni famiglia finita di sottoinsiemi aperti non vuoti ha inter- 
sezione non vuota. Ciò significa che i gruppi di cocatene di Cech a coefficienti 
in A hanno un'unica struttura, dipendente da A, ma non da X, e portano a 
invarianti omologici banali. 

La soluzione di questa difficoltà consiste nell’introdurre un gruppo «varia- 
bile» A: le coordinate delle cocatene 4,,...i, vanno assunte in dipendenza da 
U;,04NU,, e per di più in maniera interna, di modo che questa dipendenza 
rifletta le proprietà della varietà X. Il più semplice modo per realizzare ciò par- 
te dall’osservazione che a ogni insieme aperto UCX è associato il gruppo na- 
turale 0(U) delle funzioni razionali su X che non hanno singolarità in U. Se 
4;;...i, assume valore in 0(U;,,0..0U;,), è possibile definire nuovamente i 
gruppi C*(X,(U;); O). Nella descrizione di da per mezzo della formula prece- 
dente occorre tener conto del fatto che @;,...4,...i, È la restrizione della funzione 
all'insieme aperto più piccolo U;,0..:0%;0..0U;, Gli omomorfismi di CÈ 
e di 77*, legati al passaggio a un ricoprimento più fine, si possono definire come 
prima e quindi è possibile introdurre i gruppi di coomologia di Cech come li- 
mite rispetto al sistema di ricoprimenti e raffinamenti. I gruppi che si ottengono 
H*(X,9), in generale, sono già non banali e riflettono le caratteristiche omo- 
logiche essenziali di X. 

Questa costruzione è suscettibile di un’ulteriore generalizzazione. Prima di 
tutto non c’è motivo di limitarsi a considerare le funzioni razionali su X, o ge- 
neralizzazioni di questo concetto a oggetti geometrici generali quali schemi, spa- 
zi analitici o varietà differenziabili, in cui l'analogo di O viene detto fascio strut- 
turale. Un conveniente contesto è fornito dalla definizione (che per comodità 
si darà in due tempi) di fascio di gruppi (di anelli, di moduli, di insiemi, ecc.) 
su uno spazio topologico: 


DEFINIZIONE I. Si dice prefascio F sullo spazio X a valori nella categoria C 
(degli anelli, dei moduli, degli insiemi, ecc.) un funtore controvariante dalla cate- 
goria degli insiemi aperti di X nella categoria C. Un morfismo di insiemi aperti è 
un’inclusione UCV. Il corrispondente morfismo F(V)+F(U) in C si dice restri- 
zione (da V a U). 

DEFINIZIONE 2. // prefascio F si dice fascio se sono verificate alcune condizioni 
di localizzazione: per un insieme aperto U e un suo ricoprimento aperto U= VU, 
l'oggetto F(U) è univocamente determinato dalle proprie restrizioni F(U;) e si può 
ricostruire da una collezione F,e F(U;) se le restrizioni di F; e F; su U;0U;g 
coincidono, per ogni coppia 1, j. 


In questo contesto è possibile ancora definire le cocatene e la coomologia 
di X a coefficienti in un fascio arbitrario F se la categoria C dei valori di questo 
fascio è una categoria abeliana, cioè se possiede le proprietà formali della cate- 
goria dei gruppi abeliani. 
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4.4. Lo slittamento creativo proposto da Grothendieck. 


Questa costruzione tuttavia non risolve ancora il problema della formulazio- 
ne di una teoria della coomologia adeguata alla risoluzione dei problemi arit- 
metici sollevati da Weil. Uno dei motivi consiste nel fatto che, in generale, con- 
ducono a coomologie interessanti i fasci di moduli sul fascio strutturale O di 
una varietà algebrica. Se questa varietà è definita su un campo di caratteristica 
finita, come avviene nel contesto dei problemi di Weil, allora si ottengono gruppi 
di coomologia della stessa caratteristica, mentre per sfruttare appieno le idee di 
Lefschetz è necessario avere una coomologia di caratteristica zero. Grothendieck 
propose una via d’uscita a questa situazione, nella quale si sottoponeva a ulte- 
riore cambiamento lo stesso concetto di topologia. Nella variante originaria, la 
più importante per le applicazioni, al posto degli insiemi aperti U di qualche 
spazio A si considerano dei morfismi U-+X dotati di una condizione più de- 
bole di quella di essere immersioni aperte. Si espongono ora le principali de- 
finizioni di Grothendieck nella loro forma definitiva. Per brevità si evita di men- 
zionare l’universo in cui occorre lavorare. 


4.5. Famiglie coprenti e crivelli. 


Sia E una categoria. Si introduce il concetto di «topologia su E» generaliz- 
zando i dati necessari per la costruzione della coomologia di Cech che si hanno 
quando £ è la categoria degli insiemi aperti di uno spazio topologico. Questo 
DOO essere fatto in due modi, il primo dei quali è più vicino alla situazione 
classica. 


Famiglie coprenti. Si dirà che su E è data una topologia se per ogni og- 
getto .S della categoria E è definita una classe di famiglie di morfismi (t;: R;> 
=, tel), che saranno dette famiglie coprenti l’oggetto S. Ogni simile classe 
deve soddisfare le seguenti condizioni: 


a) se (t;: R;-.S, ie I) è una famiglia coprente, per ogni morfismo f: 6"+.S 
esistono i prodotti fibrati Ri= Rx S' e la famiglia (ti: Ri+S, ie/) è co- 
prente. Inoltre (id : S+,S) è una famiglia coprente; 

b) se (ti : Ri->.S, tel) è una famiglia coprente e per ogni ie/ è data una fa- 
miglia coprente (7;;: R;;>R;,jeI;), allora (t;ot;;: Ri; >R tel jel;;) è 
una famiglia coprente. 


Nel caso classico, come si è detto, gli oggetti di E sono insiemi aperti di uno 

spazio topologico, e le famiglie coprenti S sono tutti i ricoprimenti aperti di S. 
Una categoria con una topologia si dice sito. 
i Se è data una categoria C (nelle applicazioni si tratta della categoria degli 
insiemi, dei gruppi abeliani, dei moduli, ecc.), si chiama prefascio sul sito £ a 
valori in C' ogni funtore controvariante di E in C. Il prefascio F si dice fascio 
se sono verificate le due condizioni ulteriori: 


Strutture matematiche 792 


c) per ciascuna famiglia coprente (7;: R;,>S, ie/), l'applicazione indotta 
t:F(S) I] F(R;) è un monomorfismo; 


d)P applicazione 1 identifica F(.5) con l’ugualizzatore della coppia di appli- 
cazioni []FR: )= I] FR;xsR 
(J)CeIXI SIA 3 
(Questa: Sepa di applicazioni corrisponde alle proiezioni di R;xgR; ri- 


4 A f 
spettivamente sul primo e sul secondo fattore. Se M= N sono due ap- 
9 


plicazioni insiemistiche, si chiama loro ugualizzatore l’insieme {m | f(m)= 
=g(m)}. Se si tratta di applicazioni in una categoria astratta, si chiama 
loro ugualizzatore un oggetto che presenta un corrispondente «funtore 
dei punti»: cfr. anche l’articolo « Trasformazioni naturali / categorie» in 
questa stessa Enciclopedia). 


Una variante della definizione è legata al concetto di crivello. 


Crivelli. Una sottocategoria E’ della categoria £ si dice crivello se E’ con- 
tiene ogni oggetto di E per il quale esiste un morfismo verso qualche oggetto 
di E". Si denoti con p(£) la classe di tutti i crivelli della categoria E. Ogni fun- 
tore p: E+F induce un'applicazione g(p):(F)> (E). Si può assegnare una 
topologia su E indicando, per ogni oggetto S della categoria E, un insieme 
3(.S) di crivelli nella categoria Ey degli oggetti di E sopra S, con le proprietà: 


a) per ogni morfismo T'+ S il rilevamento a T di ogni crivello di 7(S) ap- 
partiene a 7(T); 

b) ogni crivello di oggetti su S, contenente qualche crivello di 7(.5), ap- 
partiene già a 7(.S); 

c) ogni crivello C' di oggetti sopra ,S, per il quale esista un crivello Re 7(S) 
tale che il rilevamento di C' a ogni oggetto X di R appartenga a 7(X), 
appartiene già a 7(.5). 


Il passaggio dalle famiglie coprenti ai crivelli non è complicato. Alla fami- 
glia coprente (1;: R;+.S, ie I) si associa il crivello di Eg costituito dagli oggetti 
f:X-%$ peri quali esiste un 7e/ tale che Homg(X, R;)# 2. 


4.6. Topoi di Grothendieck. 


Sia E un sito, vale a dire una categoria con una topologia. I fasci di insiemi 
su E costituiscono allora una categoria che è detta topos. Viene anche detta topos 
(di Grothendieck) ogni categoria equivalente a una costruita in tal modo. Pro- 
prio questo concetto, e le sue modificazioni, assunsero un’importanza partico- 
lare, oltre i limiti delle esigenze puramente algebrico-geometriche, connesse so- 
prattutto con lo studio di diverse topologie sugli schemi e delle relative teorie 
della coomologia, e condusse alla dimostrazione delle congetture di Weil. Il fat- 
to è che i topoi possiedono numerose proprietà essenziali della categoria degli 
insiemi, «relativizzate» a una base che sia un sito. 
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L'esempio tipico di topos è la categoria dei fasci di insiemi sopra uno spazio 
topologico X. Quando X consiste di un solo punto, questo topos è equivalente 
alla categoria degli insiemi: ogni fascio F è rappresentato da un insieme F(X). 
Nel caso generale ci si può rappresentare un fascio F come un «insieme varia- 
bile», i cui elementi dipendono da un sottoinsieme aperto Uc X. Molto vicini 
ai topoi di Grothendieck sono anche i modelli non-standard a valori booleani 
della teoria degli insiemi, costruiti nella teoria di Cohen-Scott-Solovay (cfr. an- 
cora l’articolo « Insieme»), per mezzo dei quali si stabilisce, ad esempio, l’indi- 
mostrabilità dell’ipotesi del continuo. Si passa ora ad esporre i concetti logici 
che hanno condotto a una variante dei topoi. 


4.7. Topoi di Lawvere e Tierney. 


Si chiamerà qui topos un oggetto assegnato mediante altri assiomi che imi- 
tano direttamente le principali costruzioni insiemistiche. Questo concetto risul- 
ta più vicino alle necessità della logica e, nello stesso tempo, è più ampio di 
quello di topos di Grothendieck. 

Precisamente, si chiamerà topos una categoria 7 nella quale sono definiti i 
prodotti diretti finiti e in cui è dato un oggetto terminale 1. Oltre a ciò, a ogni 
oggetto X di 7 si associano un oggetto P(X) ) eun monomorfismo ey : X xXx 
x P(X). Se 7 è la categoria degli insiemi, allora P(X) è l’insieme delle parti di 
X e ey è l'immersione del grafico della relazione di appartenenza e. L’assioma- 
tizzazione delle proprietà di questo grafico conduce alla seguente postulazione 
che rappresenta il principale assioma dei topoi di Lawvere e Tierney: 


ASSIOMA. Per ogni coppia di oggetti X, Y e per ogni monomorfismo i: S+ 
>Xx Y esiste un unico morfismo u:Y-»P(X) per il quale si ha un quadrato car- 


tesiano 
o Xx Y 


Jide xu 


Ds Xx P(X). 


Viceversa, per ogni morfismo u: Y+P(X) esiste un unico monomorfismo i e îl qua- 
drato precedente è cartesiano. 


Applicando questo assioma al caso Y= 1 si ottiene un morfismo u:1-+P(X) 
in corrispondenza a ogni monomorfismo 7 : S-+X. Questo morfismo si dice sot- 
toggetto di X di immagine #. In particolare l’immagine dell’applicazione iden- 
tica idy: X+X è un morfismo 1+P(X) che si denota "XI. 

Si ponga 2 = P(1). Nella categoria degli insiemi questo è {2,{2}}, la cop- 
pia dei valori «falso, vero». Se nell’assioma di topos si scambiano di posto X 
e Y, si ha la possibilità di associare a ogni sottoggetto Y dell’oggetto X il mor- 
fismo gp: X+ Q, il quale si dice morfismo caratteristico di Y. Viceversa ogni 
morfismo @ : X+ Q è il morfismo caratteristico di qualche sottoggetto di X che 
è comodo denotare con {xe_X|(x)} (nel topos degli insiemi questo è il sot- 
toinsieme xe X per cui è vera la proprietà ©). Il morfismo caratteristico del- 
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l’immagine del monomorfismo diagonale Ay: X-XxX si denota con =r € 
il morfismo caratteristico dell'immagine di ey :2y + X x P(X) si denota con €y. 


Se sono dati due morfismi f,g: X+ Y, la composizione xD viy nda 
il morfismo caratteristico di qualche sottoggetto di Y che corrisponde al nucleo 
della coppia (f, g) e che si può chiamare ugualizzatore di questa coppia. 

Dall’assioma, inoltre, si deduce che P è un funtore controvariante, come 
nel topos degli insiemi. Utilizzando questa proprietà e le costruzioni precedenti, 
si può trasformare ogni topos in un modello del linguaggio L, Set nel quale sa- 
ranno verificati gli assiomi logici intuizionisti e una parte di quelli di teoria degli 
insiemi. i 

Per stabilire un collegamento fra i topoi di Lawvere e Tierney con quelli 
di Grothendieck, si introducono ora ulteriori concetti. Si indichi con V: 1 +0 
il morfismo caratteristico del sottoggetto "1" dell'oggetto terminale I, e con 
A:QxQ+Q il morfismo caratteristico dell’ugualizzatore dei morfismi ido x V, 
Vxidg:QxQ+0. Si chiama operatore modale in 7° un morfismo j: 0-0 
che soddisfi le seguenti condizioni: jV=V, j?=j, j(xA\y)=jx/\jy, dove x e y 
sono le due proiezioni A x0+Q. (Questa definizione è motivata da quelle ana- 
loghe nelle teorie delle algebre di Boole e di Heyting, relative rispettivamente 
ai modelli della logica usuale e di quella intuizionistica). Se è fissato un tale 
operatore modale j, si denoti con $ l’ugualizzatore della coppia (j, V) e con O; 
l’ugualizzatore della coppia (j, ido). Si dice che un monomorfismo u:X>Yè 
chiuso (rispettivamente, denso) se esiste un quadrato cartesiano 


X.Y XY 
bSA rispettivamente V| 


Un sottoggetto dell’oggetto X si dice chiuso (rispettivamente, denso) se è 
l’immagine di un monomorfismo chiuso (rispettivamente, denso). DONI 

Rispetto all'operatore modale j è possibile costruire la sottocategoria piena 
T; del topos 7 costituita dagli «oggetti fascio» F che soddisfano la condizione: 
per ogni monomorfismo denso u: X+ Y e per ogni morfismo v: XF esiste 
un unico morfismo x: Y+F per il quale v=ux. 

La categoria 7; a sua volta è un topos. o. . 

Si supponga che il topos 7 consista dei funtori controvarianti della categoria 
C nella categoria S. L'oggetto O associa a ogni oggetto U di C l’insieme dei 
crivelli in Cy ed è possibile dimostrare che è equivalente assegnare un opera- 
tore modale o una topologia nella categoria C. Il topos 7; sarà allora precisa- 
mente il topos dei fasci sul sito corrispondente C. l 

Se C è la categoria degli insiemi aperti di uno spazio topologico, allora il pre- 
fascio Q associa a ogni sottoinsieme aperto U l’insieme di tutte le classi F di 
sottoinsiemi aperti di U, chiuse rispetto al passaggio a sottoinsiemi aperti. Si 
definisce il morfismo j : Q+ O in questo modo: se F è una tale classe di sottoin- 
siemi aperti di U, allora j(F) è l'insieme dei sottoinsiemi aperti di U che con- 
tengono nella loro unione gli elementi di F. In questo esempio concreto T; 
coincide con la categoria dei fasci sullo spazio topologico originario. 
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5. Strutture e fisica. 


5.1. Riferimenti alla fisica teorica. Relatività generale, campo unificato e teo- 
rie quantistiche. 


vue 


Nell’esposizione precedente ci si è interessati della realizzazione moderna 
delle idee strutturaliste in matematica, compresi i dettagli di questa realizzazio- 
ne e le particolarità della sua nascita storica. Tornando a un contesto più ampio, 
si tenterà di valutare il significato delle strutture matematiche per la conoscenza 
delle scienze naturali. Per non essere generici, si comincerà considerando bre- 
vemente le attuali relazioni fra matematica e fisica teorica. 

La matematica secondo Bourbaki, la matematica delle strutture e delle ca- 
tegorie ha un aspetto inconsueto per la fisica teorica, e i contatti fra la nuova 
matematica e la nuova fisica, molto indebolitisi a partire dagli anni ’40, soltanto 
ora cominciano a ristabilirsi. Una premessa di ciò è la rinascita del programma 
di Einstein relativo alla geometrizzazione della fisica a un livello, essenzialmente 
nuovo, su cui questo programma è considerato come un passo verso la costru- 
zione dei fondamenti di una teoria quantistica unitaria del campo. È di Einstein 
il fondamentale merito di aver scoperto la struttura con cui si descrive lo spazio- 
tempo: una varietà quadridimensionale liscia con metrica di segnatura(+———), 
e l’interpretazione delle proprietà della curvatura di questa metrica in termini di 
interazioni gravitazionali (cfr. l’articolo « Relatività » in questa Enciclopedia). 

Parallelamente avveniva nella meccanica quantistica la scoperta delle strut- 
ture con cui si descrivono la materia a livello microscopico e le sue interazioni 
coi dispositivi macroscopici usati per l’osservazione. Gli sforzi congiunti di Bohr, 
Heisenberg, Schròdinger, Born, Dirac (per ricordare soltanto i maggiori) per- 
misero anche di identificare queste strutture con i principali oggetti dell’analisi 
funzionale negli spazi di Hilbert: operatori lineari autoaggiunti e loro proprietà 
spettrali. In seguito, a questi si aggiunsero i metodi gruppali per la costruzione 
dei principali spazi e operatori, in sostituzione o a complemento del tradizionale 
linguaggio delle equazioni differenziali; il maggior contributo, in questo caso, 
fu quello di Wigner (cfr. anche l’articolo « Quanti » in questa stessa Enciclopedia). 

La teoria fisica fondamentale che attende di essere elaborata è indubbiamen- 
te la teoria dei campi quantistici. Dal punto di vista matematico una parte rile- 
vante dei principî di base per la sua elaborazione può essere formulata come una 
serie di «ricette», una parte delle quali si riferisce alla scelta di strutture della 
geometria differenziale (campi classici, oppure campi precedenti a una quantiz- 
zazione secondaria) e la parte rimanente si riferisce alla quantizzazione di que- 
ste strutture. Si descriverà qui più in dettaglio la prima parte. 


5.2. Strutture di geometria differenziale e loro motivazione fisica. 


Nei suoi tratti più generali, ogni aspetto della materia o di un campo si de- 
scrive con una fibrazione sullo spazio-tempo M, nel senso che una sezione di 
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questo fibrato si interpreta come storia virtuale dell’aspetto della materia/campo. 
Un metodo più consueto per descrivere la storia di un punto materiale per mez- 
zo della sua curva d’esistenza in M può essere ricondotto al precedente, con- 
venendo che la curva d’esistenza del punto corrisponda a una sezione di tipo 
$ del fibrato banale su M avente supporto su questa curva. Tuttavia le esigenze 
della meccanica quantistica non permettono di limitarsi a considerare soltanto 
curve di esistenza (una rigida localizzazione è incompatibile col principio di 
indeterminazione e già una particella senza spin, con un impulso fissato, corri- 
sponde a un’onda armonica che si svolge in tutto lo spazio), cioè sezioni del 
fibrato banale sullo spazio di Minkowski. 

La scelta del fibrato corrispondente al dato aspetto della materia/campo vie- 
ne condotta con un alto grado di affidabilità per le interazioni gravitazionali e 
elettromagnetiche, con un grado minore, trattandosi di un settore di ricerca, 
per le interazioni forti e deboli. Occorre tuttavia ricordare che, in una futura 
teoria unificata, anche quelle scelte che appaiono attualmente solide possono es- 
sere riviste. 

La contrapposizione materia/campo ha una lunga storia. Il ruolo autonomo 
del campo «nel vuoto», come qualcosa in grado di influire sul movimento della 
materia se questa capita nel raggio d’azione del campo, fu chiaro dopo la cono- 
scenza delle teorie di Maxwell e di Einstein. Tuttavia la teoria quantistica forzò 
la descrizione anche della materia (ad esempio degli elettroni) in termini di 
campi (per mezzo della funzione y). Questo, insieme alla scoperta delle proprie- 
tà corpuscolari del campo elettromagnetico, condusse quasi alla scomparsa della 
differenza fra «campo » e «materia». Ma nella rappresentazione contemporanea, 
almeno al livello dei modelli classici dei campi quantistici, tale differenza si ri- 
presenta. Dal punto di vista fisico i quanti dei campi si suddividono in particelle 
fondamentali e particelle portatrici di interazioni. Rientrano fra le prime i lep- 
toni e i quark, fra le seconde i fotoni e i gluoni. Nella descrizione geometrico- 
differenziale, il campo di una particella fondamentale è una sezione del fibrato 
corrispondente sullo spazio-tempo, mentre il campo che porta un'interazione 
è una connessione su questo fibrato. 

Nel linguaggio della fisica, le connessioni si chiamano campi di gauge. Il più 
semplice esempio di campo di gauge è il campo elettromagnetico; su di esso 
si vedono bene le particolarità di tali campi. Il campo elettromagnetico può es- 
sere assegnato da un vettore-potenziale, cioè da una 1-forma differenziale 
A,dx*, dove (x*) sono coordinate locali nello spazio-tempo. Tuttavia, in ac- 
cordo con la trattazione classica, sono osservabili soltanto i coefficienti della 
2-forma F=dA=%.F,,dx* dx: le componenti del tensore del campo elettro- 
magnetico. Se si identifica il campo elettromagnetico col vettore (A,,), allora oc- 
corre considerare che le variabili dinamiche (A4,) contengano un’informazione 
ridondante, non fisica: l'applicazione di gauge A4f,= A, +òd,x conduce a un cam- 
po fisicamente indistinguibile. Se poi si identifica il campo con il tensore F,,,; 
allora occorre considerare che valga l'equazione 4(44)=0, cioè la condizione 
di chiusura della forma F. 

Di fatto occorre considerare che il campo elettromagnetico sia una connes- 
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sione di qualunque fibrato della materia dotata di carica. L’idea che il campo 
elettromagnetico fosse una connessione fu espressa nel 1918 da Weyl, ma a quel 
tempo si consideravano soltanto fibrati tensoriali sullo spazio-tempo e lo schema 
fisico concreto di Weyl non risultò valido. La sua prima realizzazione corretta 
si compî con la scoperta di Dirac secondo cui il campo elettrone-positrone (re- 
lativistico, ma non ancora quantistico secondario) è una sezione del fibrato spi- 
noriale. In questo fibrato, il campo elettromagnetico induce effettivamente una 
connessione, la cui forma F è la forma della curvatura. Quest’interpretazione 
di F fu dimostrata sperimentalmente verso il 1960 mediante l’osservazione del- 
l’effetto Aaron-Bom, che prevede l'interferenza di due fasci coerenti di elettroni 
intorno a una regione di spazio che racchiude un campo magnetico. Questi fasci 
(nell’approssimazione quasi-classica) passano attraverso una regione con cam- 
po nullo; l'interferenza è il risultato della differenza di fasi quantistiche, la quale 
si descrive come la curvatura del campo elettromagnetico nella regione tra 1 fasci. 


5.3. Strutture e particelle «elementari». 


Un matematico che abbia osservato lo sviluppo della fisica delle particelle 
elementari negli ultimi anni può riassumerne lo stato in questa forma: a) il tipo 
di struttura che regola il micromondo fisico può essere considerato relativa- 
mente stabile: si tratta del G-fibrato principale sullo spazio-tempo (G è il 
gruppo delle simmetrie) e dei fibrati vettoriali ad esso associati; è) esiste una 
serie di ricette pratiche per la scelta del gruppo delle simmetrie e della lagran- 
giana, a partire da dati sperimentali; c) si hanno fondate ipotesi, sebbene non 
definitive, per la scelta di G per le interazioni forti («cromodinamica quantisti- 
ca») e per le interazioni elettriche deboli (modello di Weinberg-Salam); d) esi- 
stono delle ricette pratiche di passaggio da campi classici fittizi al computo de- 
gli effetti quantistici; e in queste ricette «c'è del metodo», come nella follia di 
Amleto. Tutto ciò è incerto e non definitivo; l'assenza di una teoria quantistica 
della gravitazione o, meglio, dello stesso spazio-tempo, lancia una sfida alle ri- 
cette pratiche. Gli schemi di supersimmetria o dei quanti spazio-temporali (se- 
condo Wheeler e Hawking) si distinguono su una fisica più «realistica», in pri- 
mo luogo per la fiducia nella matematica, cioè nell’idea di Einstein per cui la 
compatibilità interna dei principî fondamentali conduce a una comprensione 
della natura più vera rispetto a una collezione caotica di fatti. Non è dato sapere 
quando questa fiducia comincerà a realizzarsi. 


5.4. E in futuro? 


Qual è il posto delle strutture in questo quadro? Una possibile risposta con- 
siste nel fatto che la concezione di struttura secondo Bourbaki ha rivelato per 
prima un ampio universo di «significato » della matematica, in grado di mediare 
tra il formalismo e i «significati» più particolari delle costruzioni matematiche 
nelle scienze naturali, proposti insieme con le loro interpretazioni e pertanto di- 
pendenti dalla verità di queste interpretazioni, esterne alla matematica, Alla ri- 
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flessione, liberata dalla necessità di credersi realtà, occorrono altri segni condut- 
tori per non smarrirsi nella cattiva infinità del labirinto delle deduzioni formali. 
Il prodigio è nel fatto che questi stessi segni indicano anche alla matematica 
una strada utile, oltre i suoi confini. [JU.1.M.]. 
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Il concetto di struttura si formalizza, all’interno della matematica, soprattutto me- 
diante un insieme i cui elementi sono dotati di proprietà tecnicamente esprimibili in 
un linguaggio della logica matematica (per questo si veda anche assioma/postulato, 
formalizzazione, matematiche). Una maniera alternativa è quella di assegnare la 
struttura matematica di un oggetto mediante la sua appartenenza a una categoria (cfr. 
trasformazioni naturali / categorie) e di collegarlo mediante opportuni, o naturali, 
applicazioni a tutte le strutture dello stesso tipo. Questo atteggiamento, sorto nella geo- 
metria algebrica (cfr. curve e superfici, geometria e topologia, invariante, locale/ 
globale), si rivela fruttuoso anche nelle considerazioni sui fondamenti della matematica, 
soprattutto per quanto riguarda la logica intuizionista. Attraverso il concetto di struttura 
la matematica si collega poi e interagisce con altre discipline, prima fra tutte con la fisica 
teorica (cfr. anche particella, quanti, relatività, spazio-tempo) e con le scienze natu- 
rali (cfr. scienza, natura), in generale, in cui effettua una mediazione costante tra il 
formalismo e i concetti (cfr. concetto) rappresentati. 
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Trasformazioni naturali / categorie 


«Le buone teorie generali non ricercano il mas- 
simo di generalità, ma la giusta generalità ». 


[MacLane 1971, trad. it. p. 133]. 


1. Sul concetto di naturalità. 


La riflessione sul carattere più o meno naturale, spontaneo o piuttosto inna- 
turale o artificioso di enunciati, dimostrazioni o procedimenti matematici è da 
sempre intimamente connessa allo sviluppo della matematica stessa. È dunque 
difficile trattare l'argomento in generale, ma per introdurre adeguatamente il 
concetto di «trasformazione naturale» può essere utile vedere come molti ele- 
menti del discorso si siano come cristallizzati intorno a una pur semplice pro- 
posizione: si tratta della quinta proposizione del primo libro degli Elementi di 
Euclide. 

Eccone l’enunciato, nella versione di Frajese e Maccioni [1970, p. 85]: 


PROPOSIZIONE. Nei triangoli isosceli gli angoli alla base sono uguali fra lo- 
ro, e venendo prolungati i lati uguali gli angoli sotto la base saranno [pure] uguali 
fra loro. 


La dimostrazione (cfr. fig. 1) consiste nell’assumere i punti F e G, sui pro- 
lungamenti di AB e di AC, con AF= AG, e nell’osservare in primo luogo che 
i triangoli AFC e AGB sono uguali, il che si ricava da quanto precede nel testo. 
Da questo si conclude che anche i triangoli BFC e CGB sono uguali, e dunque 
anche l'angolo BCF è uguale all'angolo CBG. D'altro lato già s'è visto che l’an- 
golo ABG è uguale all'angolo ACF e, per differenza di angoli uguali, si conclu- 
de infine che gli angoli alla base sono uguali. Implicitamente già s’è visto che 
anche gli angoli sotto la base sono uguali. 

Certo tutto ciò che si utilizza nella dimostrazione ha carattere assai elemen- 


A 


Figura 1. 
L’uguaglianza degli angoli alla base di un triangolo isoscele. 
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tare, ma è davvero necessario passare attraverso questa catena di uguaglianze? 
Non può darsi una più semplice dimostrazione, ad esempio con la considera- 
zione della bisettrice dell'angolo BAC, come suggeriscono, in nota, Frajese e 
Maccioni? Per quale ragione Euclide non ha scelto una dimostrazione più facile? 
Si tratta forse, come osservano Frajese e Maccioni, d’un «pezzo forte in favore 
della teoria di Zeuthen sulla dimostrazione di esistenza, presso i Greci, median- 
te la costruzione» [ibid.]? 

In realtà, critiche a questa dimostrazione si trovano già nell’antichità. Pro- 
clo [Commento al primo libro degli Elementi di Euclide, 249, 20 - 250 sgg.] riferi- 
sce d’una dimostrazione di Pappo: «Pappo tuttavia svolge la dimostrazione in 
modo pit conciso, senza bisogno di alcuna aggiunta: sia ABC il triangolo iso- 
scele e la AB sia uguale alla AC. Immaginiamo quest’unico triangolo come se 
fosse due e ragioniamo cosi: poiché AB è uguale ad AC, e AC è uguale ad AB, 
le due rette AB, AC' sono uguali alle due AC, AB, e l’angolo BAC è uguale 
all’angolo CAB, perché sono lo stesso. Perciò le parti sono tutte uguali a tutte, 
la BC è uguale alla CB, il triangolo ABC è uguale al triangolo ACB, l’angolo 
ABC è uguale all'angolo ACB, e l'angolo ACB è uguale all’angolo ABC, per- 
ché sono sottesi dai lati uguali AB, AC; per conseguenza gli angoli alla base dei 
triangoli isosceli sono uguali ». Il senso dell’argomentazione di Pappo può dun- 
que riassumersi dicendo che, a suo giudizio, la dimostrazione euclidea ha un 
carattere artificioso, complicato, dal momento che ne esiste un’altra ben più 
evidente. 

Una celebre osservazione di Vico trae tutt’altre conseguenze: «Però, osser- 
vando il Vico cosi da Aristotile come da Platone usarsi assai sovente pruove mat- 
tematiche per dimostrare le cose che ragionano essi in filosofia, egli in ciò si 
vide difettoso a poter bene interdergli; onde volle applicarsi alla geometria e 
inoltrarsi fino alla quinta proposizione di Euclide [che è quella in esame]. E, 
riflettendo che in quella dimostrazione si conteneva insomma una congruenza 
di triangoli esaminata partitamente per ciascun lato ed angolo di triangolo, che 
si dimostra con egual distesa combaciarsi con ciascun lato ed angolo dell’altro, 
pruovava in se stesso cosa più facile l’intendere quelle minute verità tutte in- 
sieme, come in un genere metafisico, di quelle particolari quantità geometriche. 
È a suo costo sperimentò che alle menti già dalla metafisica fatte universali non 
riesce agevole quello studio propio degli ingegni minuti, e lasciò di seguitarlo » 
[1725-28, ed. 1977 pp. 14-15]. 


Come ben si vede, Vico argomenta a partire da questa proposizione sull’in- 


tero carattere del dimostrare matematico. Anche un altrettanto celebre giudizio . 


di Kant, pur di segno contrario, è dello stesso tenore: «Innanzi a colui che di- 
mostrò i primi teoremi sul triangolo isoscele (fosse Talete o chiunque al- 
tro) si accese una gran luce, poiché comprese che non doveva seguire ciò che 
via via vedeva nella figura, né attenersi al semplice concetto della figura stessa, 
quasi dovesse apprenderne le proprietà; ma doveva produrre la figura (costruen- 
dola) secondo ciò che con i suoi concetti pensava e rappresentava in essa a priori; 
comprese cioè che per sapere con sicurezza qualcosa a priori, non doveva attri- 
buire alla cosa se non ciò che risultava necessariamente da quanto, conforme- 
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mente al suo concetto, egli stesso vi aveva posto» [1787, trad. it. pp. 41-42]. 

Qui non interessa il carattere che Kant giudica proprio del dimostrare ma- 
tematico; si desidera portare l’attenzione sulla «gran luce», sulla verità che que- 
sto teorema è in grado di arrecare, indipendentemente dalla tecnica dimostrati- 
va. In qualche modo, il giudizio di Vico è ribaltato, ma con una considerazione 
della matematica altrettanto globale, pur a partire da una singola proposizione. 
Luce od oscurità si riverberano sulla totalità, perché v'è omogeneità fra la parte 
e il tutto. A proposito di questo problema è interessante rilevare come Ia scrit- 
trice Lalla Romano in Una giovinezza inventata (1979, cap. XVII) riporti un gu- 
stoso aneddoto relativo a Peano sulla sua insofferenza per l’espressione « dimo- 
strò il triangolo isoscele ». Non è inopportuno accostare quest’episodio agli esem- 
pi che si stanno qui svolgendo. 

L'ultimo autore che si vuole considerare è Bergson: «Ma allorquando io 
traccio grossolanamente sulla sabbia la base di un triangolo, e comincio a for- 
mare i due angoli alla base, so in maniera certa e comprendo assolutamente che, 
se questi due angoli sono eguali, anche i lati lo saranno, poiché la figura può ri- 
girarsi su se stessa senza che nulla sia alterato. Lo so ben prima d’aver appreso 
la geometria. Cosî anteriormente alla geometria dotta, vi è una geometria natu- 
rale la chiarezza e l'evidenza della quale superano quella delle altre deduzioni» 
[1907, ed. 1970 p. 674]. Anche Bergson, in qualche modo, trascura gli aspetti 
dimostrativi nel far risalire la verità a un fatto intuitivo. È però evidente che 
nel riproporre nella sostanza l’idea di Pappo, implicitamente giudica in favore 
della sua dimostrazione. 

Gli esempi qui riportati, sostanzialmente uniti solo dal riferirsi a una stessa 
proposizione d’Euclide, mostrano una pluralità di idee e di giudizi. Ma preme 
osservare come molti elementi che si troveranno nelle pagine seguenti siano già 
impliciti: l’idea che si possa distinguere tra la verità d’un enunciato e il modo 
con cui esso si rivela per vero, la necessità d’una «coerenza» tra le singole pro- 
posizioni, d’un ugual livello dimostrativo; oppure l’indifferenza verso questi 
aspetti e l’enfasi sul risultato. Tutto questo, in modo implicito o esplicito, ap- 
parirà nel seguito. 


2. Trasformazioni naturali. 


Il concetto di trasformazione naturale è stato elaborato per la prima volta 
da Eilenberg e MacLane [1942] studiando l’isomorfismo tra un gruppo finito e 
il suo doppio gruppo dei caratteri. L'argomento, ripreso in forma pit organica 
dai due autori [1945], conduce alla prima esposizione sistematica della teoria 
delle categorie (si veda anche l’articolo « Funzioni » in questa stessa Enciclopedia, 
VI, p. 491). Non c’è modo migliore per ripresentare organicamente l’argomento 
di quello di rifarsi all'esempio addotto dai due autori. 

Sia L uno spazio vettoriale di dimensione finita sul campo reale; il suo spa- 
zio duale 7(L) è allora lo spazio vettoriale delle applicazioni da L a R (si veda 
anche l’articolo «Dualità» in questa stessa Enciclopedia, V, pp. 136-37). Come 
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è ben noto, lo spazio T(L) è a sua.volta uno spazio vettoriale su R della stessa 
dimensione di L. Gli spazi L e T(L) sono dunque isomorfi. Ma questo isomor- 
fismo non può essere esplicitato se non scegliendo una base per lo spazio L; 
inoltre scelte differenti della base conducono a isomorfismi differenti. L’iso- 
morfismo che collega L a T(L) è dunque legato a una nostra scelta. 

La situazione cambia completamente se si considera il doppio duale T(T(L)), 
che si indicherà con 7*(L). In questo caso l’isomorfismo che collega L a T*(L) 
può essere dato direttamente, senza ricorrere alla scelta di alcuna base in L; 
la scelta è inoltre data in modo simultaneo per tutti gli spazi vettoriali di di- 
mensione finita. Se infatti si considera un vettore x di L, per ogni applicazione 
lineare # di T(L) risulta definito un numero reale calcolando # su x, cioè #(x). 
Se ora si immagina, in t(x), non x ma ? variabile, si ottiene un’applicazione da 
T(L) a R. Ogni elemento di L è dunque interpretabile come un’applicazione 
da T(L) a R, cioè come un elemento di 7?(L). In tal modo si ottiene un’appli- 
cazione t(L):L-+T?(L) che, come si vede facilmente, è un isomorfismo (si 
veda ancora «Dualità », p. 137). 

In che senso questo isomorfismo è «naturale»? Intuitivamente, si può dire 
che, poiché la determinazione di t(L) è data da L stesso, senza alcun intervento 
di scelta da parte nostra la naturalità si rivelerà tale «al variare di L». 

In termini precisi, sia A: L+L' un’applicazione lineare fra due spazi vet- 
toriali di dimensione finita (il modo con il quale si descrive la variazione in 
questo contesto); essa induce una corrispondente applicazione fra T*(L) e 
T®(L'). Si consideri infatti il diagramma LS L'5 R: esso suggerisce come 
per ogni applicazione #': L'4 R si abbia, per composizione, un’applicazione 
A :L+R. Cioè l'operazione di comporre con X induce un’applicazione che si 
dirà T(A): T(L')-+T(L), la quale è facilmente vista essere lineare a sua volta 
(7 è un «funtore controvariante»; cfr. oltre, e anche l’articolo « Applicazioni» 
in questa stessa Enciclopedia, I, p. 741). 

Data T(A):7(L')>T(L), utilizzando il medesimo procedimento si otterrà 
T°():T*(L)> T°(L'). 

Si dispone ora di tutti gli elementi; precisamente: a) per ogni L, un iso- 
morfismo t(L):L+7?(L); 5) per ogni applicazione lineare X: L+ ZL’, una cor- 
rispondente applicazione lineare T?(2): T*(L)> T2(L'). 

Con questi dati, è possibile considerare il diagramma 


L TL) T®(L) 
O A ro 
13L") ma/ri 


ed ecco ora come si può esplicitare il concetto di naturalità: il diagramma (1) 
è commutativo, ossia, in termini di composizioni di applicazioni, X-r(L')= 
=7(L)-T°(). 

La verifica della commutatività di (1) segue facilmente dall’interpretare i 
simboli delle applicazioni che vi compaiono. La verifica del fatto che la commu- 
tatività di (1) sia una spiegazione «adeguata» non è invece affidabile a un sem- 
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plice calcolo. In parte sarà trattata in questo articolo, per la più gran parte si 
fonda sull’esistere concreto della teoria delle categorie. 

Intanto, l'esempio stesso è suscettibile di un’indagine più approfondita, 
che consenta di cogliere elementi generali, al di là di questa particolare situa- 
zione. Si può intanto isolare come un momento concettuale a sé della nostra 
spiegazione il passaggio da L a T°(L), evidenziandone le proprietà. Tale pas- 
saggio agisce a due livelli: al livello degli spazi vettoriali, poiché per ogni spazio 
L dà uno spazio 7?(L); al livello delle applicazioni tra spazi vettoriali, poiché 
per ogni X: L+L' dà T°(X): T?(L)+ T?(L'). Si può poi mostrare come le pro- 
prietà che agiscono in modo essenziale siano: 


1) all'identità 17:L2-+L, 7? (si indica con 7° l’intero processo) associa l’i- 
dentità 1y2g):7T*(L)>T?®(L); 

2) alla composizione di due applicazioni X, X/, 7? associa la composizione 
di T2(1) e di T7°(X°); cioè 72) = T*()7T2(N). 


La 1) e la 2) definiscono 7? come un funtore (cfr. ancora «Applicazioni», 
p. 7741) che agisce dalla totalità degli spazi vettoriali di dimensione finita; la si 
indichi con V, in se stessa: T2:V+V. (Due osservazioni: non v'è possibilità 
d’errore nell’indicare l’agire di 7? ancora con una freccia. Inoltre, la «totalità» 
degli enti di un certo tipo è naturalmente problematica anche nel contesto della 
teoria delle categorie. Non si affronteranno qui tali questioni, rinviando per 
esempio a MacLane [1971, trad. it. pp. 36-40] o a Lolli [1977] e si farà libera- 
mente uso della terminologia naive). 

opportuno anche pensare la situazione X:L-+L' come descritta da un 
funtore: naturalmente sarà il funtore identico Z:V+V per il quale /(L)=L e 
I(X)=2. 

Si dispone ora di due funtori 7° e / da V a V ed è possibile definire 7 a par- 
tire dai 7(L) come una trasformazione naturale da / a T?. Si scriverà 1:/-+ 7°. 
Il diagramma (1) diviene ora 

IL) 7arT°(L) 
(2) 10) |a) 
I(L')aT(L') 


che è la definizione di 7 come trasformazione naturale fra i due funtori I e 7°, 
ossia il «dato» di tutte le applicazioni t(L), per ogni L, con per ogni A:L+L' 
la commutatività di (2). 

Legati ancora all’esempio particolare, si sono tuttavia evidenziati due con- 
cetti generali, quello di funtore e quello di trasformazione naturale. Un nuovo 
concetto scaturisce dall’indagare quali proprietà in realtà siano richieste al « do- 
minio » e al «codominio» di un funtore: il concetto di categoria. 

Una definizione formale di categoria è ricorsa più volte negli articoli di que- 
sta Enciclopedia (si vedano « Applicazioni», p. 736, nel contesto insiemistico, e 
«Funzioni», p. 491, con una definizione analoga a quella di «metacategoria» 
[cfr. anche MacLane 1971, trad. it. pp. 19-20]). Disponendo di essa è facile 
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adattare la definizione di funtore da V a V al caso generale di due categorie A 


e B. Allora, se 7 e G sono due funtori A B, AS B, una trasformazione 
naturale 7: F--> G è assegnata dando per ogni oggetto A di A un morfismo 
t4: F(A)-G(A) tale che per ogni morfismo f: A+B il diagramma 


F(A)-% G(A) 
FD} Jem 
F(B)-E+ G(B) 


sia commutativo (cfr. ancora «Dualità», pp. 155-56). 

Si osserverà come in questa presentazione funtori e categorie appaiano co- 
me concetti subordinati per esprimere la naturalità. E tale era certo agli inizi 
la situazione teorica. Va osservato tuttavia che in seguito la situazione si è equi- 
librata poiché le strutture descritte come categorie hanno rivelato intrinseca- 
mente grandi capacità euristiche. Oggi si parla senz'altro di teoria delle catego- 
rie, forse anche perché le trasformazioni naturali non sono l’unico caso ove si 
esplica il concetto di naturalità (si veda in seguito, ad esempio, il concetto di 
coppia di funtori aggiunti). 

Per concludere, ecco ora alcune considerazioni. Osserva MacLane: « Una 
trattazione diretta delle categorie in quanto tali apparve in Eilenberg e MacLane 
(1945). Ora la scoperta d’idee generali come queste è soprattutto la propensione 
a fare un’astrazione avventata o di carattere speculativo, in questo caso sostenu- 
ta dal piacere di sottrarre parole ai filosofi: “categoria” ad Aristotele e Kant, 
‘funtore” a Carnap (Logische Syntax der Sprache), e “trasformazione natura- 
le” al linguaggio informale allora corrente » [1bid., p. 46]. Il tono scanzonato non 
deve trarre in inganno (non si dimentichi fra l’altro che MacLane è stato al- 
lievo di Bernays): fin dall'inizio la teoria si presenta con precise istanze filoso- 
fiche. Al termine dell’introduzione del loro articolo Eilenberg e MacLane osser- 
vavano: «Il carattere invariante di una disciplina matematica può essere formu- 
lato in questi termini. Cosi nella teoria dei gruppi tutte le costruzioni basilari 
possono essere riguardate come definizioni di funtori covarianti o controvarian- 
ti, cosî che è possibile formulare il detto: l'argomento della teoria dei gruppi è 
essenzialmente lo studio di quelle costruzioni gruppali che si comportano in 
maniera covariante o controvariante per gli omomorfismi indotti. Più precisa- 
mente, la teoria dei gruppi studia funtori definiti su ben specificate categorie 
di gruppi, con valori in altre categorie simili. Questo può essere considerato 
come una continuazione del Programma di Erlangen di Klein, nel senso che 
uno spazio geometrico con il suo gruppo di trasformazioni è generalizzato a una 
categoria con la sua algebra di morfismi» [1945, p. 237]. 

Ma nell’immediato i fatti non parvero accordarsi con le previsioni. Afferma 
ancora MacLane: «Nel successivo decennio 1945-55 le categorie sono state po- 
co studiate, la teoria delle categorie era solo un linguaggio, ed eventuali ricerca- 
tori possono essere stati scoraggiati dal diffuso dubbio pragmatico di ‘nonsense 
astratto generale” (teoria delle categorie)» [1971, trad. it. p. 133]. In realtà la 
situazione pareva suggerire che le principali istanze del concetto di categoria 
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si riducessero a insiemi con una certa struttura e loro morfismi (gruppi, anelli, 
moduli, ecc. ). Era poco operante l’idea di utilizzare una descrizione intrinseca 
delle categorie stesse (sebbene presente fin dall’inizio), e mancavano esempi si- 
gnificativi di categorie non descrivibili come in precedenza. La situazione cam- 
bierà progressivamente, verso la fine degli anni ’50, con la scoperta da parte 
di Grothendieck (1957) «che le categorie di fasci (di gruppi abeliani) sopra 
uno spazio topologico erano categorie abeliane ma non categorie di moduli, e 
che l’algebra omologica in queste categorie era necessaria per una trattazione 
completa della coomologia in un fascio (Godement, 1958)» [7bid., p. 256]. A 
questa si affiancherà, nel 1958, la scoperta da parte di Daniel Kan dei funtori 
aggiunti. 

Per procedere in modo non banale nell’esame degli sviluppi successivi oc- 
corre ora illustrare qualchè costruzione categoriale. 


3. Qualche costruzione categoriale. 


Le costruzioni che vengono qui esposte risultano molto chiare se vengono 


pensate con l’idea-guida che i morfismi X-+ A, che hanno per codominio un og- 
getto A di una categoria C, debbano essere considerati come «elementi genera- 
lizzati di A». Sviluppare quest'idea, dandole concretezza, richiede un appro- 
fondimento teorico che, in parte, sarà sviluppato nelle pagine seguenti. Ci si 
limiterà per ora a far notare come quest'idea sia una generalizzazione dell’abi- 
tuale nozione di elemento negli insiemi. 

Sia S (dall’inglese sez) la categoria degli insiemi [si rinvia ancora a MacLane 
1971 o a Lolli 1977 per il senso con il quale si devono intendere «tutti gli in- 
siemi », nel contesto categoriale] e si consideri in essa l’insieme formato da un 
solo elemento {x}. Si indica abitualmente tale insieme con 1. La caratterizza- 
zione di 1 in termini di morfismi è data dal fatto che, per ogni insieme 4, esi- 
ste esattamente un morfismo A+ 1, cosa di immediata verifica. Complementar- 
mente, gli elementi di A corrispondono esattamente ai morfismi 1+A, nel 
senso preciso che c'è una corrispondenza biunivoca fra questi morfismi e gli 
elementi di A. 

Due generalizzazioni si presentano ora possibili: per ogni categoria C, ove 
vi sia un oggetto come 1 (oggetto terminale), è possibile definire gli elementi 
di un oggetto A come i morfismi 1+ A. Si parla in tal caso di «elementi globali» 
o «eterni» (Lawvere) di A: una generalizzazione utile, ma più utile è quella 
che si è predescritta, ove viene generalizzato anche il dominio dei morfismi di 
codominio 4. 

Ecco ora qualche applicazione. Negli insiemi, una funzione f, con f: A+B, 
è detta iniettiva quando, dati due elementi a, a' di A, con a#da', si ha di conse- 
guenza f(a) #f(a'). O anche: f(a)=f(a') implica a=a'. Questa stessa defini- 
zione, data nel contesto categoriale, con la definizione di elemento generalizza- 
to conduce al concetto di monomorfismo (mono). 


17 
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DEFINIZIONE. f: 4-B è un monomorfismo se, per ogni coppia di morfismi 
a:X>A, d':X>A, I 
X3A4A5B 
(#4 


l'uguaglianza af=a'f implica a=a'. 


Nel già citato articolo «Funzioni» si è descritto (p. 492) il prodotto carte- 
siano cercando soprattutto di mettere in evidenza la sua proprietà universale. 
È facile ora rendersi conto del fatto che, con questa nuova definizione di ele- 
mento, essa consiste esattamente nel dire che il prodotto cartesiano è l’insie- 
me delle coppie di elementi (generalizzati). 

Nello stesso spirito, si veda ora l’ugualizzatore. Negli insiemi, date due fun- 


ENI î n DE f Reti 
zioni f, g aventi lo stesso dominio A e lo stesso codominio B, A = B si può de- 


I 
finire quel sottoinsieme S di A formato dagli elementi x di A tali che f(x) =g (x). 
Il sottoinsieme S di A, nel contesto che qui interessa, va pensato come un mo- 
nomorfismo m: S+A [per una profonda discussione sul fatto che il concetto 
di sottoinsieme SCA è «troppo astratto» e che un concetto più adeguato è 
quello di «essere sottoinsieme in modo determinato», ossia l'assegnazione di 
un monomorfismo m : S+ A che precisi il «modo».in cui S è sottoinsieme di 
A si rinvia a Lawvere 1972-73. L'argomento è efficacemente ripreso in Meloni 
1974-77]. Ora, ogni elemento di A che renda uguali f e g è già in S. Ciò motiva 
la seguente 


DEFINIZIONE. L’ugualizzatore di due morfismi f: A-+B e g: A-B è un mor- 
fismo m: S-A tale che, per ogni morfisno x: XA con xf =xg 


Su 
tale 
Arno È 


vi sia esattamente un morfismo h conhm=x. 


(Nella definizione, si preferisce richiedere l’unicità di 4 piuttosto che m sia un 


monomorfismo). 
In modo analogo si potrebbero motivare ora altre costruzioni. Per non es- 
sere troppo didascalici si presenta direttamente la definizione di prodotto fibrato. 


DEFINIZIONE. Dati due morfismi f: A>X e g:B-+X 
B 
Jo 
A i X 
il prodotto fibrato dei due morfismi è dato da un oggetto Y e da una coppia di mor- 
fismi n, :V-+ A e mg:Y>B tali che il quadrato 
Y—_- B 


|a do 
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sia commutativo. Inoltre, se Z-%> A e Z-£ B sono altri due morfismi per i quali 
hf =kg, allora esiste un unico morfismo p:Z+Y 


VS cp 
h 
val Le 
A->X 


tale che qrj=he gr, =k. 


I concetti di monomorfismo, ugualizzatore, prodotto cartesiano e prodotto 
fibrato, or ora presentati, costituiscono dispositivi essenziali della teoria delle 
categorie. Essi possono tutti essere unificati come «limiti finiti» [si veda Mac- 
Lane 1971, trad. it. cap. Im]. Accanto a questi si dànno i concetti « duali», otte- 
nuti pensando ad essi nella categoria opposta (con gli stessi oggetti e le frecce 
in senso contrario). A titolo d’esempio: 


DEFINIZIONE. Dati 1 due morfismi f: A-+B e g: A+B il loro cougualizza- 
tore è dato da un morfismo p:B-+T tale che, per ogni morfismo y:B+Y con 
Îy=gy vi sia esattamente un morfismo R:T+Y con pr=y. 


A4B®T 
P) N 
Y 


In modo analogo si hanno i concetti di epimorfismo (epi), duale di quello 
di monomorfismo, di coprodotto, duale di quello di prodotto e di coprodotto 
fibrato, duale di quello di prodotto fibrato. In seguito si farà liberamente uso 
di tutti questi concetti. 


4. Funtori aggiunti. 


Il concetto di coppia di funtori aggiunti, isolato per la prima volta da Kan 
[1958], è certo fondamentale nella teoria delle categorie e corrisponde a una 
pluralità di situazioni molto diversificata e articolata (e proprio la sua capaci- 
tà unificante dà la sua gran carica concettuale). 

Esso non è quindi ricavabile come generalizzazione da un esempio princi- 
pale, come è stato fatto in precedenza. È più opportuno quindi premettere la 
definizione astratta e mostrare poi con successivi esempi la ricchezza di con- 
tenuti. 


DEFINIZIONE. Siano A e B due categorie e F, G due funtori con F:A-+B e 
G:B4+A. Si dirà che F è l’aggiunto sinistro di G (e si scriverà F4G) se, per 
ogni coppia di oggetti A in A e B in B, è dato un isomorfismo ©, n, naturale in 
Ae Btrai due insiemi di morfismi B(F(A),B)e A(A,G(B)), 


P4,p:B(F(A),B)=A(A,G(B)). 
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(Con la notazione C(X,Y) si indica, dati X e Y oggetti di una categoria C, 
l'insieme dei morfismi da X a Y. La definizione di funtori aggiunti si trova an- 
che nel già citato articolo « Dualità», funzionale tuttavia a un discorso diverso). 

Di grande aiuto, forse per la persuasività dell'immagine, è raffigurare la si- 
tuazione di aggiunzione con lo schema 


A. G(B) 
F(A)> B 
(si è semplificato indicando @4,g con @). La naturalità rispetto agli oggetti A 
e B può essere descritta in termini di trasformazioni naturali introducendo i 


funtori adeguati dalla categoria prodotto di A°P e di B in S. Ma se ne può dare 
una descrizione molto semplice utilizzando la figura seguente: 


A' h A 2. G(B) GR), G(B') 


FA Fg BE 


La naturalità si può ora esprimere con g(F(4)f)=40(f)econ p(f-4)=%9(f)G(£). 


Ecco ora alcuni esempi. 


Esempio 1. 


Sia Vet la categoria degli spazi vettoriali su un determinato campo X, e 
U:Vet-S il funtore «dimenticante», che considera cioè per ogni spazio vetto- 
riale V i vettori di V semplicemente come un insieme (dimenticando la strut- 
tura). Sia U(V) tale insieme. Sia B il funtore che a ogni insieme .X associa lo 
spazio vettoriale B(X) con base X su K. Allora, per ogni insieme X e ogni 


spazio V si ha x+U(7) 
B(X)>V 
cioè B-4U, poiché un morfismo tra spazi vettoriali è individuato esattamente 


assegnando le immagini dei vettori della base. La naturalità, come si vede, si- 
gnifica che la corrispondenza è definita în modo uniforme per X e V. 


Esempio 2. 


Si consideri la categoria degli insiemi S. Dati due oggetti A e B è possibile 
formare il loro prodotto cartesiano A x B; dato ancora un oggetto C, è possibi- 
le considerare anche B°, la totalità delle funzioni da C a B. Si ha ora 


A-+C 
AxB+C 


a causa del procedimento familiare con il quale una funzione di due variabili 
si può ridurre a una sola variabile cambiando in modo opportuno il codominio. 
Questo significa che il funtore ( )x B, definito dall’effettuare il prodotto car- 
tesiano di un insieme per B e in modo conseguente sui morfismi, è aggiunto 
sinistro del funtore di altrettanto ovvia descrizione ( )F:( )xB-()P. 
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Esempio 3. 


Siano A e B due preordini (cioè categorie tali che per ogni coppia di oggetti 
vi sia al più un morfismo tra questi). Allora la situazione 


A+G(B) 
FA)>B 


significa A<G(B) se e solo se F(A)<B. Nel caso B=C° si ha una connessio- 
ne di Galois. 


Esempio 4. 


È questo l’esempio più importante (almeno per chi scrive). Si tratta della 
descrizione dei quantificatori come funtori aggiunti [Lawvere 1969]. 

Si consideri una situazione matematica ove intervenga uno dei quantifica- 
tori H, V. Si immagini per esempio di passare dalla formula xy =1 alla formu- 
la dx(xy=1). 

Passare dalla prima alla seconda formula è anche un fatto «linguistico»: una 
formula diviene un’altra formula. Si possono dare delle regole che consentano 
di dire che la seconda esprime in modo adeguato il concetto «esiste un x tale 
che... » (cfr. l'articolo « Logica » in questa stessa Enciclopedia, VIII, pp. 506 sgg.). 
Ma si utilizza qui un punto di vista estensionale. x e y saranno variabili intese 
a indicare gli elementi di un certo insieme A, per esempio un anello. Allora 
con xy=1 si individua quel sottoinsieme di Ax A dato dalle coppie (x,y), le 
quali sono formate appunto dagli elementi il cui prodotto è l’unità 


S 


J S={(x,y)|xy=1}. 
AxA 


Si può ora considerare la funzione «seconda proiezione» da Ax A ad A defi- 
nita con xs3(x,y)=y. 

È possibile infine considerare il sottoinsieme S' di A dato da quegli y che 
provengono mediante x, dagli elementi di S 


S S' 
(3) dd 
AxXA-®>A 


Sono, naturalmente, gli elementi di A per i quali esiste un x con xy =1. 
Tutta l’azione del quantificatore può allora essere descritta come l’associare 


8 è . n è . < + 
a S+ Ax A (si evidenzia ancora il modo con cui S è contenuto in A x A) un 


s' x . < . . ee 
S'-A. Come è definito s'? Esso non è che l’immagine della composizione srt. 
Per mettere in evidenza questo fatto si scriverà s' = _,,(s). Ma il modo stesso 
della definizione suggerisce una generalizzazione. Si consideri 


S 
J 


Apt 
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ove X sostituisce (Ax 4) e Y (A). Non è altrettanto facilmente definibile 
s':.S'+ Y come l’immagine di sf? Questa definizione è tuttavia suscettibile di 
essere riformulata in maniera ancora più profonda. Il morfismo f: X+Y de- 
finisce per ogni morfismo 4: R-+ Y attraverso il prodotto fibrato 


O-R 
Fai CO) A 
Ag 


un nuovo morfismo f*(4): Q0-+X. Nel caso degli insiemi è evidentemente l’im- 
magine inversa di 4: R-+ Y, ma, si osserverà, esso è definibile in ogni categoria 
ove esistano i prodotti fibrati. Negli insiemi, poi, indicando l’immagine di sf 
con (5) e considerato un morfismo #:7+ Y, si ha (in termini di sottoin- 
siemi): 


ST 
s| IL SCf*(T) se e solo se 1;(5) CT. 
Apt 


Ma occorre esprimersi con più esattezza, Si osservi a tal fine che i morfismi 

di codominio X possono considerarsi come gli oggetti di una nuova categoria 

S/X per la quale si possono definire i morfismi 0. :(S1-+X)-(S,-+X) come 

triangoli commutativi e 

Si Sy 
e, 


Considerando dunque le due categorie S/X e S/Y è ora possibile ridescrivere 
f* come un funtore, con f*:$/Y-+S/X. Pensando ora esattamente d;(5) come 
4,(s), cioè considerando l’immagine di sf come un'azione sui morfismi e non 
sui sottoinsiemi, si ha un funtore YU,. Ora, come è immediato verificare, 


s>f*(1) 
A(S) >? 
cioè Hd; Af*. 

Questa definizione del quantificatore esistenziale, che ha come parallela la 
descrizione del quantificatore universale come f#4V,, è evidentemente suscet- 
tibile di applicarsi a ogni situazione ove le costruzioni categoriali necessarie sia- 
no possibili, e dunque anche in contesti diversissimi dagli insiemi astratti. 

Il caso dei fasci è molto istruttivo. Poiché più volte in quest’Enciclopedia s'è 
definito rigorosamente il concetto di fascio (si veda ad esempio l’articolo « Dif- 
ferenziale», IV, p. 826), si presenterà qui una descrizione intuitiva che ha il 
merito tuttavia di suggerire le generalizzazioni presentate nel paragrafo se- 
guente. NA 

Si supponga di disporre di una serie di «stadi» U, U', U”, -, peri quali si 
dia un concetto di «approfondimento». In termini tecnici, essi costituiscono 
un preordine. Si ha cioè una relazione tra le coppie U, U” che si indica con 
U=>U' riflessiva e transitiva: cioè 1) U=U; 2) U=U' e U'=U" implica 
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U=>U". Naturalmente, nel caso U>U", si penserà U' come «uno stadio più 
profondo». 

Occorre ora assumere un'ulteriore proprietà. In termini intuitivi: dati due 
stadi U e V, esiste’ uno stadio che approfondisce entrambi UAV. In termini 
rigorosi, si dirà che l’insieme preordinato ammette un estremo inferiore per 
ogni coppia di elementi. 

Ecco ora il concetto di prefascio: un prefascio X è il dato di un insieme 
X(U) per ogni stadio U e di un’applicazione tra insiemi pyyv per ogni coppia 
di insiemi U= U', con le proprietà ulteriori: pyy = Lrw)i gue: Pu = eno 
Per continuare nella metafora, si può pensare a un elemento xe X(U) come a 
un «individuo allo stadio U». pyy-(x) sarà allora lo stesso individuo a uno sta- 
dio ulteriore. 

È facile rendersi conto che tutti i dati di un prefascio sono racchiusi nell’os- 
servazione che il preordine degli stadi U, U', ... è una particolare categoria P, 
i cui oggetti sono gli stadi e i cui morfismi sono dati dalla corrispondenza 
U>U'-UU'. Un prefascio X è semplicemente un funtore controvarian- 
te PP} S. Dati due prefasci X, Y, un morfismo tra prefasci, con tutta natura- 
lità, è definito come una trasformazione naturale f: X -+ Y. Questo significa che, 
per ogni U=>U', si ha il quadrato commutativo 


x(U)-+y(U) 
ovul Jovv' 


X(U')>Y(U') 


Naturalmente cyy: sono le applicazioni corrispondenti di Y. 

È facile interpretare la commutatività del quadrato: un elemento di X(U) 
viene mandato da fr; in un elemento fr(x)e Y(U). Ma pyy/(x) è «lo stesso 
elemento» allo stadio U', cosi come cyy:(fy(x)) è «lo stesso elemento» allo 
stadio U'. Allora, ovviamente, chiedere la commutatività del quadrato prece- 
dente significa tener conto della particolare nozione di elementofindividuo che 
si è data. 

Si immagini ora, in termini di prefasci, la situazione corrispondente a quella 
esaminata all’inizio di questo lungo esempio: 


S 

s 

x4y 
ove S, X, Y sono ora prefasci e s, f trasformazioni naturali. In questo caso HU, 
e V; non sono suscettibili di alcuna interpretazione se non nei termini descritti, 
cioè come aggiunti sinistro e destro di f*. E tali aggiunzioni si interpretano in 


modo molto suggestivo. Si veda ad esempio Y,, il più interessante în questo 
caso. Occorre dunque che sia (con le stesse notazioni usate in precedenza) 


t>V;(5) 
MORA 


Trasformazioni naturali / categorie 508 


Come è facile verificare, questo conduce a descrivere V,(s) in questo modo: 
V;(5)={y|f*(y)<s5}. Se in particolare si pensa a SCX e a TCY (senza ba- 
dare al modo della inclusione) si ha V;(5S) ={y|f*(y) CS} 

Ma le inclusioni che compaiono nella formula precedente sono, si ricordi, 
trasformazioni naturali, il che significa certo che per ogni livello U si debba 
avere V;(.5)(U)={yeY(U)|f&(y).S(U)}, ma anche che deve esservi com- 
patibilità tra i livelli. Non basta che y al livello U verifichi la definizione, oc- 
corre anche che per un livello V, con U=V, il trasformato di y, cyy(y) verifi- 
chi la definizione al livello V. Cioè V,(S)(U)={yeY(U)|f&()CS(U) e, per 
ogni V<U, cyy(y) verifichi f$(cyr(y)) £S(V)}. Si usa dire che l’interpreta- 
zione del quantificatore V è universale nei prefasci. L’interpretazione del quan- 
tificatore U è invece semplicemente quella livello per livello (attuale), e non è 
perciò molto interessante. Diviene invece di grande interesse nel caso dei fasci 
che si illustreranno ora. 

Occorre un concetto di «ricoprimento » (topologia di Grothendieck) di uno 
stadio (se ne può trovare la definizione completa nell’articolo « Locale/globa- 
le» di questa stessa Enciclopedia, VIII, p. 486. Una trattazione dettagliata si 
ha poi in Johnstone [1977]). Per ogni stadio U sono assegnate certe famiglie 
{U,; | ieI} di sottostadi U,<U, le quali si giudicano «coprenti» (la terminolo- 
gia è presa dagli spazi topologici, dove queste famiglie sono i ricoprimenti aper- 
ti). In qualche modo, U è «rappresentato » dagli U;. Naturalmente, per avere 
una teoria efficace occorre che queste famiglie siano descritte con opportuni 
assiomi (si veda ancora « Locale/globale»), ma, per le esigenze di quest'articolo, 
essi possono essere sottintesi. 

Sia ora F un certo prefascio. Esso sarà specificato come un fascio descri- 
vendo il suo comportamento rispetto alle famiglie coprenti. Sia {U;} un rico- 
primento dello stadio U. Si hanno allora i morfismi gyy,, i quali associano a 
ogni individuo allo stadio U una collezione di individui x, agli stadi U,, con 
x;=vu;(x). Si ottiene un fascio quando si specifica quali sono le famiglie x; 
di elementi di F(U;) che provengono esattamente in questo modo. Se U, e U, 
sono due sottostadi di U del ricoprimento, l’ipotesi fatta sulla relazione d’ordi- 
ne è che esista U; \U;. Si hanno allora anche i morfismi py;u;nup £0;U;AU ! 
quali consentono di trasportare un elemento di U; e un elemento di U, al li- 
vello U;\ U;. Si ha allora il concetto di famiglia compatibile: una famiglia di 
elementi x,€ F(U;) tale che py;v;nv;(*) = Pu;vinv;(£;). Ed ecco ora la 


DEFINIZIONE. I/ prefascio F è un fascio se per ogni famiglia compatibile x; co- 
me quella precedente esiste esattamente un xe F(U) con pyu;(*) =%x;- 


La situazione 
S 
o 
XA 


può ora essere esaminata in termini di fasci. Si vede l’interpretazione di H,;(s). O 
meglio, semplificando ancora, con l’inclusione SCX, H;(S). Il risultato è il 
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seguente: y € 1;(.5)(U) non solo quando esiste un x in S(U) con fy(x) =y, ma 
anche quando ciò avviene per un numero sufficiente di livelli ulteriori. Esatta- 
mente, esiste un ricoprimento {U,} tale che gli y; = gy7;(y) sono in fy,(S(U;)). 

L'elemento y può non stare nell’immagine a un certo livello, ma questo 
può succedere a y in stadi «più profondi». Se questo avviene un numero suffi- 
ciente di volte (per un ricoprimento) allora y è in 4,(5)(U). Si dice anche che 
y è «localmente» nell’immagine. 

Queste profonde idee di Lawvere possono essere descritte in molti ulteriori 
e fecondi sviluppi sui quali non ci si soffermerà. Ci si limiterà ad osservare che 
l’interpretazione dei quantificatori nei fasci apre la via a una trattazione della 
«logica » in questa situazione che è ricca di sviluppi profondi. [Per un’esposizio- 
ne esauriente e dettagliata si veda Meloni 1974-77]. 


5. Al concetto di topos elementare. 


Il concetto di topos di Grothendieck è già intervenuto in numerosi articoli 
di questa stessa Enciclopedia (si veda ancora «Locale/globale», VIII, pp. 486- 
487) e già s'è accennato all’idea di Lawvere di considerare ogni topos come 
l’ambito naturale di una «logica interna» ad esso canonicamente associata. T'ut- 
tavia l’idea di Lawvere è anche intimamente connessa a una generalizzazione del 
concetto di topos di Grothendieck, senza la quale probabilmente essa sarebbe 
assai meno efficace. 

Per citare Johnstone, l’idea scaturisce dall’osservare che «ogni topos di 
Grothendieck ha un oggetto dei valori di verità Q, e che la nozione di topolo- 
gia di Grothendieck è strettamente connessa agli endomorfismi di Q» [1977, 
p. xIv]. Qui ci si limiterà a presentare il primo punto, rinviando allo stesso 
Johnstone [:did., pp. 76 sgg.] per il concetto di topologia in un topos elementare 
e per altri interessanti sviluppi della teoria. Si vedrà nel paragrafo successivo 
un'importante direzione di ricerca non ancora oggetto di sviluppi sistematici. 


DEFINIZIONE. Un topos elementare è dato da una categoria E I) con tutti i 
limiti finiti; 2) che ammetta per ogni oggetto X un funtore esponenziale ( )X ag- 
giunto destro del funtore ( )x X. (In tal caso, E si dice cartesianamente chiusa); 
3) che ha un sotto-oggetto classificatore (2; cioè un oggetto e un morfismo « vero» 
v:1-Q, tale che per ogni monomorfismo f:Y-+ X vi è una funzione classificante 
©;, con ©: X- tale che sia un prodotto fibrato il diagramma 


YI 


L’assioma più caratteristico è certamente il terzo; se ne veda ora l’interpre- 
tazione nel caso degli insiemi astratti. £2 è dato semplicemente da {0,1} (falso 
e vero) e v è definita v(1)=1. Un monomorfismo f è un «modo » per descrivere 
Y come sottoinsieme di X. ©; è la funzione caratteristica, che vale 1 sugli ele- 
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menti di X che sono immagini di elementi di Y e o altrimenti. Nel caso gene- 
rale Q non si ridurrà a due elementi, ma conterrà altri «valori di verità». 

Come si vede, tutto è assai semplice, in questo caso. Ciò dipende da una 
contraddizione (sottolineata da Lawvere) che si manifesta nel caso degli insie- 
mi: da un lato gli insiemi, come il caso più «astratto», rappresentano una situa- 
zione poco interessante (si tenga presente che gli insiemi possono pensarsi co- 
me i fasci sulla categoria formata da un solo oggetto con i morfismi ridotti alla 
identità); d’altro lato, quando viene colta negli aspetti essenziali una costruzio- 
ne che può essere effettuata negli insiemi — con attenzione ad utilizzare come 
strumenti dimostrativi solo quelli della logica intuizionista —, la costruzione può 
essere trasferita in ogni topos. Gli insiemi astratti sono dunque un formidabile 
strumento euristico. 

Un teorema [se ne veda la dimostrazione ibîd., p. 24] e un esempio da- 
ranno ora un'idea dell'estensione del concetto di topos elementare: 


TEOREMA. Ogni topos di Grothendieck è un topos elementare. 


D'altro lato, come è assai facile verificare, la categoria degli insiemi finiti non 
è un topos di Grothendieck, pur essendo un topos elementare. 

I topoi elementari sono dunque < più generali» dei topoi di Grothendieck, il 
che, come ricorda l’epigrafe posto all’inizio di questo articolo, può essere di in- 
teresse assai scarso. Ma il fatto è che essi colgono, con la descrizione assiomati- 
ca che s'è vista, gli aspetti realmente centrali della teoria, consentendone uno 
sviluppo facile e diretto. La maggior generalità fornisce al tempo stesso un pre- 
zioso materiale per interpretare teorie logiche prive di modelli nel caso classico. 
Nel paragrafo seguente ci si soffermerà su un esempio di questo genere; non 
si accennerà invece agli sviluppi della teoria, per cui si può vedere Meloni 


[1974-77]. 


6. Il calcolo differenziale dal punto di vista categoriale. 


In occasione della pubblicazione degli atti di un convegno su Topos- Theore- 
tic Methods in Geometry and Analysis, tenuto ad Aarhus nel maggio 1978, il 
curatore Kock ha posto come primo articolo Categorica! Dynamics di Lawvere. 
Si tratta di una serie di conferenze che risalgono al 1967, le quali, pur rimaste 
inedite per anni, hanno avuto larga influenza su molti ricercatori. In una nota 
esplicativa posta all’inizio, Lawvere osserva come: «In queste conferenze, io 
davo alcuni calcoli preliminari per favorire un programma per (3) assiomatiz- 
zare la fondazione della meccanica dei continui nello spirito di Walter Noll 
sulla base di (2) una assiomatizzazione diretta dell’essenza della topologia dif- 
ferenziale usando risultati e metodi dei lavori francesi in geometria algebrica 
(alcuni dei quali ho appreso da Gabriel); ma mi accorsi poi che questo richie- 
de (1) lo studio assiomatico delle categorie di insiemi lisci, simili ai topoi di 
Grothendieck, poiché la forma più naturale di (2) è incompatibile con la usuale 
teoria degli insiemi» [1967, p. 1]. 
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Ci si soffermerà brevemente sul punto (2) indicando uno sviluppo dovuto 
essenzialmente a Kock, utilizzando il primo [Kock 1975-76] di una serie di ar- 
ticoli su questo problema. 

Cosa significa intanto l’incompatibilità con l’usuale teoria degli insiemi? Si- 
gnifica essenzialmente che in essa non è possibile disporre di un’adeguata for- 
malizzazione dei procedimenti differenziali con l’uso diretto degli infinitesimi. 
Ciò è invece possibile per gli «insiemi variabili», i topoi, e si ottiene cosi il du- 
plice vantaggio di utilizzare strutture spesso più «aderenti» a ciò che si esamina 
- i topoi appunto —, ove i procedimenti differenziali si dìnno in modo assai 
semplice. 

L’idea-guida di quanto si esporrà ora è che per una funzione f, definita in 
un valore a, se d è un infinitesimo, sarà f(a+d)=f(a)+b-d. Cioè una funzione 
lineare. Ovviamente allora db =f(a). 

Come si vede non è esattamente una novità, da un certo punto di vista: 
lo è invece nel senso che esistono contesti non banali ove questo approccio è 
possibile e agevole. 

Sia allora E un topos elementare (in realtà per molti sviluppi si può chie- 
dere meno, ma ci si pone direttamente in questo contesto per semplicità) e sia 
A un oggetto anello in esso. Ciò significa che sono dati certi morfismi 4 x A SA, 
Ax A >> A, AT A,1-+ A4,1-+ A, che corrispondono alle abituali opera- 
zioni di un anello, la somma, il prodotto, ecc. Naturalmente queste operazioni 
debbono soddisfare a determinati assiomi, il che significa che si richiede la com- 
mutatività di certi diagrammi. Si vede, ad esempio 4+0 =, per ogni elemento 
a. Ciò significa che i due morfismi 


AzAx1SAxASA 
| 
A la 


debbono essere uguali. In modo analogo si procede per gli altri assiomi. 
Occorre ora l’oggetto D degli infinitesimi. Esso è fornito dall’ugualizzatore 
dei due morfismi 


ASSI AxA_> A 


ro? 
I 


In termini di «elementi» si tratta dei 4 tali che 4?=0. Accanto a D si hanno i 
due funtori ( )x D e ( )}P, con ( )xD-( )P (cfr. p. 509), e dunque i morfismi 


AxD3 A 
A 
AH 42° 
» . . o . » a . . A di 
ove + si ottiene per aggiunzione. Ancora, in termini di elementi, + è il mor- 


fismo definito da a-+a+( ) ove la parentesi va «riempita» con gli infinitesimi. 
a+( )è la funzione che per ogni d vale 4+d. 
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Sia ora « il morfismo A x A >> A? che, descritto direttamente sugli elementi, 
è dato da (4,, 4,)-+41+43( ) [cfr. ibid., p. 3 per la descrizione in termini di dia- 
grammi]. 

Ora è facile osservare che A?, come nel caso degli insiemi ove si definisco- 
no le operazioni «punto per punto», è a sua volta un anello; a si mostra facil- 
mente essere un omomorfismo di anelli. Ed ecco ora il fatto fondamentale [cfr. 
ibid., p. 8]: 


ASSIOMA. I morfismo « è invertibile. 


—1 
. è n x D x 
Sia ora y il morfismo definito da AP "+ Ax A A, ove py è la seconda 
proiezione. Ed ecco ora l’operazione di derivazione: 


DEFINIZIONE. Dato il morfismo f: A-+A, la sua derivata è data da 
È gp? 
A AP ADDA. 


Si osserverà che A-> 405, AP ha per aggiunta A x D LA A,cheèil mor- 
fismo definito sugli elementi con (a,d)+f (a+d). Allora, per il significato del- 


l’aggiunzione, il morfismo A 495, AD è dato, ancora sugli elementi da f(a+ 
+( )). Ora, con y, prima si associa a questa funzione l’unica funzione lineare 
corrispondente (per l'assioma) — sia 4;+4,( ) — e poi con la seconda proiezione 
si prende 4,. 

Questa nella sostanza la spiegazione della definizione. Da questa definizione 
conseguono con grande facilità tutti i consueti sviluppi del calcolo differenziale 
sui quali, ovviamente, non è il caso di insistere. 

Ed ecco ancora un possibile modello [cfr. ibid., pp. 13-14]. Sia R la catego- 
ria degli anelli commutativi finitamente presentati, e sia © la categoria dei fun- 
tori covarianti verso la categoria degli insiemi. Allora l'inclusione di Yoneda 


R°P-5 % valutata su Z [X] dà un oggetto anello con le proprietà richieste. Si 
tratta naturalmente del «riflesso» della abituale differenziazione formale dei 
polinomi [ibid., p. 17]. 

Il lettore avrà osservato come spesso accanto ai diagrammi v'era una facile 
«lettura» in termini di elementi. Non è possibile perseguire direttamente que- 
sto punto di vista? In effetti molti degli ultimi approcci stimolati ancora da 
Lawvere vanno in questa direzione. Naturalmente occorre però rendersi conto 
che, poiché i modelli non sono negli insiemi ma negli «insiemi variabili», oc- 
corre trattare gli elementi con la logica intrinseca ad essi, cioè la logica intui- 
zionista [cfr. Casella e Meloni 1980; Meloni 1974-77]. 


7. Conclusione. 

All’autore di quest'articolo è capitato, chiedendo a Takeuti un giudizio su 
una recente ridimostrazione, da parte di Lawvere e Tierney, del risultato di 
Cohen sull'ipotesi del continuo, d’avere nella sostanza questa risposta: con la 
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teoria delle categorie si può riformulare, chiarire, penetrare più a fondo se si 
vuole; ma non si può in realtà « dimostrare». I suoi metodi sono troppo astratti 
e generali per intervenire con reale efficacia a promuovere risultati. Solo dopo 
che un risultato è stato acquisito si può intervenire in maniera categoriale. 

È certo importante, si può osservare, che il lemma di Yoneda unifichi cose 
all'apparenza assai distanti come le sezioni di Dedekind e il teorema di rappre- 
sentazione di Cayley, ma questo è un fatto «concettuale », non un effettivo ri- 
sultato suscettibile di incrementare lo sviluppo della ricerca matematica. 

A obiezioni di questo genere si potrebbe rispondere citando titoli di merito, 
teoremi effettivamente dimostrati, ecc. Ma questa risposta sarebbe estrinseca. 
Si può invece farsi carico delle obiezioni e vedere che cosa esse realmente si- 
gnificano. Che cosa, in effetti? Riflettono una concezione della matematica che 
tiene separati da un lato l’operare «concreto», l'effettivo ottenimento dei risul- 
tati, dall’altro il riflettere sui metodi, sulle procedure sui legami tra le parti 
della matematica. Separazione forzata e insostenibile. 

Hilbert, a detta di Gordan, avrebbe fatto teologia e non matematica scio- 
gliendo il famoso problema degli invarianti, ma chi oggi non accetta, oltre ai 
suoi risultati, anche le tecniche usate? 

È certo vero che l’aritmetica di Frege non aiuta affatto ad eseguire meglio le 
operazioni aritmetiche, ma è difficile sostenere che essa non abbia avuto esiti 
importanti anche sulla «pratica» matematica: si pensi all'importanza dell’ana- 
lisi delle dimostrazioni dal punto di vista del calcolo con l’elaboratore. Cost ciò 
che realmente viene a manifestarsi non è che la volontà di tenere separato ciò 
che per sua natura è intimamente unito. 

Infine un'osservazione: soprattutto a partire dagli anni ’70, ossia dai topoi 
elementari, s'è avuto uno sviluppo imponente della ricerca nel campo delle ca- 
tegorie: si hanno ormai molte centinaia di articoli. Difficile cosî dare una vi- 
sione sistematica e unitaria, enucleare le idee centrali. Ma, in ogni caso, è que- 
sto che occorre fare, e che certo quest’articolo avrà fatto solo in parte, rifiutan- 
do la comoda e sgradevole immagine d’un vasto inesplorato e inesplorabile ter- 
ritorio ove l’«esperto» non può che manifestare la propria solidarietà al «pro- 
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Bergson, H.-L. 
1907 L’Evolution créatrice, Alcan, Paris; ed. Presses Universitaires de France, Paris 1970. 


Casella, A., e Meloni, G. C. 
1980 Introduzione alle quantità variabili con infinitesimi, Istituto di Matematica dell’Univer- 
sità di Milano, Milano. 
Eilenberg, S., e MacLane, S. 
1942 Natural isomorphisms in group theory, in «Proceedings of the National Academy of 
Sciences of the United States of America», XXVIII, pp. 537-43. 
1945 General theory of natural equivalences, in « Transactions of the American Mathematical 
Society », LVIII, pp. 231-094. 
Frajese, A., e Maccioni, L. 
1970 Commento agli Elementi di Euclide, Utet, Torino. 


Trasformazioni naturali / categorie 514 


Johnstone, P. T. 
1977 Topos Theory, Academic Press, New York. 


Kan, D. M. 
1958  Adjoint functors, in «Transactions of the American Mathematical Society », LXXXVII, 
pp. 294-329. 
Kant, I. 


1787 Kritik der reinen Vernunft, Hartknoch, Riga 1787? (trad. it. Utet, Torino 1967). 


Kock, A. 
1975-76 A Simple Axiomatic for Differentiation, Matematisk Institut, Aarhus Universitet, 
Aarhus. 
Lawvere, W. F. 
[1967] Categorical Dynamics, in A. Kock (a cura di), Topos- Theoretic Methods in Geometry 
and Analysis, Matematisk Institut, Aarhus Universitet, Aarhus 1978. 
1969 Adjointness in foundations, in « Dialectica», XXIII, 3-4, pp. 281-95. 
1972-73 Teoria delle categorie sopra un topos di base, Istituto di Matematica dell’Università 
di Perugia, Perugia. 


Lolli, G. 
1977 Categorie, universi e principî di riflessione, Boringhieri, Torino. 
MacLane, S. 


1971 Categories for the Working Mathematician, Springer, New York - Heidelberg - Berlin 
(trad. it. Boringhieri, Torino 1977). 


Meloni, G. C. 
1974-77 La logica degli insiemi variabili con continuità: algebra intuizionista e teoria dei fasci, 
Istituto di Matematica dell’Università di Milano, Milano. 


Vico, G. 
[1725-28] Vita di Giambattista Vico scritta da se medesimo, s. e., Venezia 1729; ed. Einaudi, 
Torino 1977. 


AI concetto di categoria si è giunti dopo che il concetto di trasformazione naturale 
è stato astratto (cfr. astratto/concreto) dalla pratica della topologia algebrica (cfr. geo- 
metria e topologia). Ma esso è anche al termine di un processo (cfr. dialettica, storia, 
tempo/temporalità) non privo di interazioni con il pensiero filosofico (cfr. categorie/ 
categorizzazione, filosofia/filosofie, sistematica e classificazione) e con le rifles- 
sioni della fine del secolo scorso sulla natura della geometria (cfr. invariante). La teoria 
(cfr. teoria/modello) delle categorie, limitata dapprima a un comodo linguaggio per 
descrivere certe realtà (cfr. reale, spiegazione) matematiche, ha acquisito due im- 
portanti approfondimenti con la scoperta del concetto di aggiunzione e soprattutto con 
il concetto di topos (cfr. applicazioni, strutture matematiche), proseguito poi con 
quello di topos elementare (cfr. elementi, infinitesimale, locale/globale). Di qui im- 
portanti interazioni con la logica, la geometria algebrica e, in generale, il dispiegarsi di un 
vasto programma fondazionale. 


